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Neiie Alkoholdehydrogenasen 

Die Erfindung betrifft neue Polypeptide mit der biologischen Aktivitat einer NAD- oder 
NADP-abhangigen Alkoholdehydrogenase. Des weiteren betrifft die Erfindung diese 
Polypeptide kodierende Nukleinsauren, nicht-menschliclie Wirte oder Wirtszellen 
sowie Reaktionssyteme, nnit welchen gewunsclite Produkte hergestellt werden 
konnen. Die erfindungsgemaBen Polypeptide werden bevorzugt in der Herstellung, 
ausgehend von Aldehyden bzw. Ketonen, von prinnaren und enantiomerreinen, 
sekundaren Alkoholen eingesetzt, die als Zwischenprodukte fQr Arzneimittel dienen 
kOnnen. Alternativ konnen die erfindungsgemaBen Polypeptide auoh fQr die 
umgekehrte Reaktion, also die Oxidation von Alkoholen unter Ausbildung von 
Aldehyden bzw. Ketonen, eingesetzt werden. 

In der Beschreibung ist auf eine Anzahl an Dokunnenten verwiesen. Der 
Offenbarungsgehalt dieser Dokumente ist hiermit durch Bezugnahme inkorporiert. 

Enantiomerenrelne Alkohole gehoren zu den bedeutendsten chiralen Bausteinen 
CChiral Building Blocks") der industriellen Spezial- und Feinchemie. Unter anderem 
fungieren diese Produkte als essentielle Schlusselintermediate bei der Herstellung 
von Arzneimitteln. Der industrielle Weg zu diesen ZielmolekQIen fuhrte lange Zeit 
vorzugsweise Ober rein chemische Prozesse, beispielsweise auf dem Weg der 
Racematspaltung. Dabei wird ausgehend von einem Keton zunachst der Alkohol in 
racemischer Form hergestellt und dann das gewunschte Enantiomer in einer 
Racematspaltung unter Zuhilfenahme von mindestens stochiometrischen Mengen 
eines chiralen Hilfsstoffes Isoliert. Die Nachteile dieser Methodik sind nicht nur die 
maximal 50%Hge Ausbeute bei der Racematspaltung, sondern sind auch in der 
Verwendung zahlreicher okologisch problematischer Einsatzstoffe bei der 
Herstellung des Racemats zu sehen. Weitere Nachteile bestehen in dem 
zusatzlichen Arbeitsschritt fur das Recycling des ungewunschten Enantiomers, wie 
auch im Bedarf chiraler Hilfsreagenzien (noch dazu in stochiometrischen Mengen) fur 
die Racematspaltung. Das Konzept der Racematspaltung ist in Gleichung (1a) in der 



Obersicht in Figur 1 zusammengefasst Ein erster wesentlicher Fortschritt zu einem 
nachhaltigeren Verfahren konnte mit der biokatalytischen Racematspaltung erzielt 
werden, wodurch die Notwendigkeit des Einsatzes stochiometrischer Mengen von 
chiralen Hilfreagenzien entfailt BedauerlichenA/eise bleiben aber samtliche anderen 
obig aufgezahlten Nachteile trotz eines solchen biokatalytischen Weges relevant. 

Ein Weg, bei dem vorstehend beschriebene Nachteile der Racematspaltung bzw. 
diastereoselektlver Synthesen vermieden werden konnen, besteht in der direkten 
Umwandlung von Ketonen in die gewunschten optisch aktlven Alkohole in einem 
Schritt. Solche „direkten asymmetrischen Prozesse" konnen zum einen unter 
Venwendung von metallhaltigen Chemokatalysatoren durchgefCihrt werden, wobei als 

• Chemokatalysatoren Schwermetall-haltige Komplexe, die einen chiralen Liganden 
beinhalten, zum Einsatz kommen. Neben dem Einsatz okologisch problematischer 
Schwermetalle als wesentlicher Katalysatorkomponente ist auch der Bedarf an 
teuren und teiiweise sehr empfindlichen Liganden, beispielsweise 
Phosphanliganden, nachteilig. 

Eine weitere Alternative stellt die direkte asymmetrische Reduktion unter 
Verwendung geeigneter Biokatalysatoren fur die quantitative Umwandlung von 
prochiralen Substraten zum gewunschten enantiomerenreinen Produkt dar. Die 
Anzahl der Reaktionsschritte wird auch hier auf das theoretisch mogliche Minimum 
von nur einem Schritt verkQrzt, die biokatalytische Umwandlung erfolgt unter 

• okologisch vorzQglichen Bedingungen (u.a. Wasser als Solvens), und der Prozess 
als solcher verlauft mit hoher Atom5konomie. Das Konzept eines solchen 
biokatalytischen und nachhaltlgen Verfahrens ist in Gleichung (1b) der Obersicht In 
Figur 1 aufgefQhrt. 

Ein Nachteil der biokatalytischen Variante ist allerdings der Mangel an im 
industriellen MaRstab verfugbaren Alkoholdehydrogenasen als geeignete 
Biokatalysatoren fur die Zielreaktion sowie deren Expression. Das der vorliegenden 
Erfindung zugrunde liegende technische Problem war deshalb, zu neuen, effizienten 
und industriell einsetzbaren Alkoholdehydrogenasen zu gelangen. Dieses technische 
Problem wird durch die in den Anspruchen gekennzeichneten AusfQhrungsformen 
gelost 
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Somit betrifft die Erfindung ein Polypeptid mlt der biologlschen Aktivltat einer NAD- 
oder NADP-abhanglgen Alkoholdehydrogenase, das eine der nachfolgenden 
Sequenzen umfasst oder aufweist: die Sequenz der SEQ ID NO.: 1, die Sequenz der 
SEQ ID NO.: 2, die Sequenz der SEQ ID NO.: 3 oder eine Sequenz, die zu 
mindestens 90% identisch mit der Sequenz der SEQ ID NO.: 3 ist. Vorzugsweise ist 
die Sequenz zu mindestens 95% identisch mit der SEQ ID NO.: 3. Starl<er bevorzugt 
ist die Sequenz zu mindestens 98% oder 99% identisch mit SEQ ID NO.: 3. Ferner 
umfasst ist die Sequenz der SEQ ID NO.: 4. Des weiteren umfasst ist die Sequenz 
der SEQ ID NO.: 5 oder eine Sequenz, die zu mindestens 90% identisch mit der 
Sequenz der SEQ ID NO.: 5 ist. Vorzugsweise ist die Sequenz zu mindestens 95% 

• identisch mit der SEQ ID NO.: 5. StSrker bevorzugt ist die Sequenz zu mindestens 
98% Oder 99% identisch mit SEQ ID NO.:5. Femer umfasst ist die Sequenz der SEQ 
ID NO.: 6 Oder eine Sequenz, die zu mindestens 90% identisch mit der Sequenz der 
SEQ ID NO.: 6 ist. Vorzugsweise ist die Sequenz zu mindestens 95% identisch mit 
der SEQ ID NO.: 6. Starker bevorzugt ist die Sequenz zu mindestens 98% oder 99% 
identisch mit der SEQ ID NO.: 6. Ebenfalls umfasst ist die Sequenz der SEQ ID NO.: 
7 Oder eine Sequenz, die zu mindestens 70% identisch mit der Sequenz der SEQ ID 
NO.: 7 ist. Vorzugsweise ist die Sequenz zu mindestens 75% identisch mit der SEQ 
ID NO.: 7. St&rker bevorzugt ist die Sequenz zu mindestens 80% identisch mit der 
Sequenz der SEQ ID NO.: 7. Noch starker bevorzugt ist die Sequenz zu mindestens 
85%, 90%, 95%, 98% oder 99% identisch mit der Sequenz der SEQ ID NO.: 7. 

• Ferner umfasst ist die Sequenz der SEQ ID NO.: 8 oder eine Sequenz, die zu 
mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 8 ist. Vorzugsweise ist 
die Sequenz zu mindestens 75% identisch mit der SEQ ID NO.: 8. Starker bevorzugt 
ist die Sequenz zu mindestens 80% identisch mit der Sequenz der SEQ ID NO.: 8. 
Noch starker bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 
99% identisch mit der Sequenz der SEQ ID NO.: 8. DarOber hinaus umfasst ist die 
Sequenz der SEQ ID NO.: 9 oder eine Sequenz, die zu mindestens 70% identisch 
mit der Sequenz der SEQ ID NO.: 9 ist. Vorzugsweise ist die Sequenz zu mindestens 
75% identisch mit der SEQ ID NO.: 9. Starker bevorzugt ist die Sequenz zu 
mindestens 80% identisch mit der Sequenz der SEQ ID NO.: 9. Noch starker 
bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 99% identisch 
mit der Sequenz der SEQ ID NO.: 9. Ebenfalls umfasst ist die Sequenz der SEQ ID 
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NO.: 10 Oder eine Sequenz, die zu mindestens 70% identisch mit der Sequenz der 
SEQ ID NO.: 10 ist. Vorzugsweise ist die Sequenz zu mindestens 75% identiscii mit 
der SEQ ID NO.: 10. Starker bevorzugt ist die Sequenz zu mindestens 80% identisch 
mit der Sequenz der SEQ ID NO.: 10. Noch starker bevorzugt ist die Sequenz zu 
mindestens 85%, 90%, 95%, 98% oder 99% identiscii mit der Sequenz der SEQ ID 
NO.: 10. Ferner umfasst ist die Sequenz der SEQ ID NO,: 1 1 oder eine Sequenz, die 
zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 1 1 ist. Vorzugsweise 
ist die Sequenz zu mindestens 75% identisch mit der SEQ ID NO.: 11. Starker 
bevorzugt ist die Sequenz zu mindestens 80% identisch mit der Sequenz der SEQ ID 
NO.: 11. Noch starker bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 

_ 98% Oder 99% identisch mit der Sequenz der SEQ ID NO,: 11, Des weiteren umfasst 
ist die Sequenz der SEQ ID NO.: 12 oder eine Sequenz, die zu mindestens 60% 
identisch mit der Sequenz der SEQ ID NO.: 12 ist Vorzugsweise ist die Sequenz zu 
mindestens 65% identisch mit der SEQ ID NO.: 12. Starker bevorzugt ist die 
Sequenz zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 12. Noch 
starker bevorzugt ist die Sequenz zu mindestens 75% oder 80% identisch mit der 
SEQ ID NO.: 12. Besonders bevorzugt ist die Sequenz zu mindestens 85%, 90%, 
95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 12. Ebenfalls 
umfasst ist die Sequenz der SEQ ID NO.: 13 oder eine Sequenz, die zu mindestens 
60% identisch mit der Sequenz der SEQ ID NO.: 13 ist. Vorzugsweise ist die 
Sequenz zu mindestens 65% identisch mit der SEQ ID NO.: 13. Starker bevorzugt ist 

_ die Sequenz zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 13. 
Noch starker bevorzugt ist die Sequenz zu mindestens 75% oder 80% identisch mit 
der SEQ ID NO.: 13. Besonders bevorzugt ist die Sequenz zu mindestens 85%, 90%, 
95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 13. Ferner umfasst 
ist die Sequenz der SEQ ID NO.: 14 oder eine Sequenz, die zu mindestens 75% 
identisch mit der Sequenz der SEQ ID NO.: 14 ist. Vorzugsweise ist die Sequenz zu 
mindestens 80% identisch mit der Sequenz der SEQ ID NO.: 14. Starker bevorzugt 
ist die Sequenz zu mindestens 85% identisch mit der Sequenz der SEQ ID NO.: 14. 
Noch starker bevorzugt ist die Sequenz zu mindestens 90%, 95%, 98% oder 99% 
identisch mit der Sequenz der SEQ ID NO.: 14. Daruber hinaus umfasst ist die 
Sequenz der SEQ ID NO.: 15 oder eine Sequenz, die zu mindestens 95% identisch 
mit der Sequenz der SEQ ID NO.: 15 ist. Vorzugsweise ist die Sequenz zu 
mindestens 98% oder 99% identisch mit der Sequenz der SEQ ID NO.: 15. Ferner 
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umfasst ist die Sequenz der SEQ ID NO.: 16 oder eine Sequenz, die zu mindestens 
95% Identiscli mit der Sequenz der SEQ ID NO.: 16 ist. Vorzugsweise ist die 
Sequenz zu mindestens 98% oder 99% identisch mit der Sequenz der SEQ ID NO.: 

16. Des weiteren umfasst ist die Sequenz der SEQ ID NO.: 17 oder eine Sequenz, 
die zu mindestens 75% identiscli mit der Sequenz der SEQ ID NO.: 17 ist. 
Vorzugsweise ist die Sequenz zu mindestens 80% identisch mit der Sequenz der 
SEQ ID NO.: 17. Starl^er bevorzugt ist die Sequenz zu mindestens 85% identisch mit 
der Sequenz der SEQ ID NO.: 17. Noch starker bevorzugt ist die Sequenz zu 
mindestens 90%, 95%, 98% oder 99% identisch mit der Sequenz der SEQ ID NO.: 

17. Ebenfalis umfasst ist die Sequenz der SEQ ID NO.: 18 oder eine Sequenz, die zu 
mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 18 Ist. Vorzugsweise ist 

• die Sequenz zu mindestens 75% identisch mit der SEQ ID NO.: 18. Starker 
bevorzugt ist die Sequenz zu mindestens 80% identisch mit der Sequenz der SEQ ID 
NO.: 18. Noch starker bevorzugt ist die Sequenz zu mindestens 85%, 90%, 96%, 
98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 18. Ferner umfasst Ist die 
Sequenz der SEQ ID NO.: 19 oder eine Sequenz, die zu mindestens 70% identisch 
mit der Sequenz der SEQ ID NO.: 19 ist. Vorzugsweise ist die Sequenz zu 
mindestens 75% identisch mit der SEQ ID NO.: 19. Starker bevorzugt ist die 
Sequenz zu mindestens 80% identisch mit der Sequenz der SEQ ID NO.: 19. Noch 
starker bevorzugt Ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 99% 
Identisch mit der Sequenz der SEQ ID NO.: 19. DarOber hinaus umfasst ist die 
Sequenz der SEQ ID NO.: 20 oder eine Sequenz, die zu mindestens 60% Identisch 

• mit der Sequenz der SEQ ID NO.: 20 ist. Vorzugsweise ist die Sequenz zu 
mindestens 65% Identisch mit der SEQ ID NO.: 20. Starker bevorzugt ist die 
Sequenz zu mindestens 70% Identisch mit der Sequenz der SEQ ID NO.: 20. Noch 
starker bevorzugt ist die Sequenz zu mindestens 75% oder 80% identisch mit der 
SEQ ID NO.: 20. Besondere bevorzugt ist die Sequenz zu mindestens 85%, 90%, 
95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 20. Ferner umfasst 
ist die Sequenz der SEQ ID NO.: 21 oder eine Sequenz, die zu mindestens 90% 
identisch mit der Sequenz der SEQ ID NO.: 21 ist. Vorzugsweise ist die Sequenz zu 
mindestens 95% identisch mit der Sequenz der SEQ ID NO.: 21. Starker bevorzugt 
Ist die Sequenz zu mindestens 98% oder 99% identisch mit der Sequenz der SEQ ID 
NO.: 21. Des weiteren umfasst ist die Sequenz der SEQ ID NO.: 22 oder eine 
Sequenz, die zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 22 ist. 
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Vorzugsweise ist die Sequenz zu mindestens 75% identisch mit der SEQ ID NO.: 22. 
Starker bevorzugt ist die Sequenz zu mindestens 80% identiscii mit der Sequenz der 
SEQ ID NO.: 22. Besonders bevorzugt ist die Sequenz zu mindestens 85%, 90%, 
95%, 98% Oder 99% identiscii mit der Sequenz der SEQ ID NO.: 22. Ebenfalls 
umfasst ist die Sequenz der SEQ ID NO.: 23 oder eine Sequenz, die zu mindestens 
55% identisch mit der Sequenz der SEQ ID NO.: 23 ist. Vorzugsweise ist die 
Sequenz zu mindestens 60% identisch mit der SEQ ID NO.: 23. Starker bevorzugt ist 
die Sequenz zu mindestens 65% identisch mit der Sequenz der SEQ ID NO.: 23. 
Noch starker bevorzugt ist die Sequenz zu mindestens 70% oder 75% identisch mit 
der SEQ ID NO.: 23. Besonders bevorzugt ist die Sequenz zu mindestens 80%, 85%, 
90%, 95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 23. Ferner 
umfasst ist die Sequenz der SEQ ID NO.: 24 oder eine Sequenz, die zu mindestens 
65% identisch mit der Sequenz der SEQ ID NO.: 24 ist. Vorzugsweise ist die 
Sequenz zu mindestens 70% identisch mit der SEQ ID NO.: 24. St3rker bevorzugt ist 
die Sequenz zu mindestens 75% identisch mit der Sequenz der SEQ ID NO.: 24. 
Noch starker bevorzugt ist die Sequenz zu mindestens 80% oder 85% identisch mit 
der SEQ ID NO.: 24. Besonders bevorzugt ist die Sequenz zu mindestens 90%, 95%, 
98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 24. Des weiteren umfasst 
ist die Sequenz der SEQ ID NO.: 25 oder eine Sequenz, die zu mindestens 55% 
identisch mit der Sequenz der SEQ ID NO.: 25 ist. Vorzugsweise ist die Sequenz zu 
mindestens 60% identisch mit der SEQ ID NO.: 25. Starker bevorzugt ist die 
Sequenz zu mindestens 65% Identisch mit der Sequenz der SEQ ID NO.: 25. Noch 
starker bevorzugt ist die Sequenz zu mindestens 70% oder 75% identisch mit der 
SEQ ID NO.: 25. Besonders bevorzugt ist die Sequenz zu mindestens 80%, 85%, 
90%, 95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 25. Femer 
umfasst ist die Sequenz der SEQ ID NO.: 26 oder eine Sequenz, die zu mindestens 
55% identisch mit der Sequenz der SEQ ID NO.: 26 ist. Vorzugsweise Ist die 
Sequenz zu mindestens 60% identisch mit der SEQ ID NO.: 26. StSrker bevorzugt ist 
die Sequenz zu mindestens 65% identisch mit der Sequenz der SEQ ID NO.: 26. 
Noch starker bevorzugt ist die Sequenz zu mindestens 70% oder 75% identisch mit 
der SEQ ID NO.: 26. Besonders bevorzugt ist die Sequenz zu mindestens 80%, 85%, 
90%, 95%, 98% Oder 99% identisch mit der Sequenz der SEQ ID NO.: 26. Ebenfalls 
umfasst ist die Sequenz der SEQ ID NO.: 27 oder eine Sequenz, die zu mindestens 
55% identisch mit der Sequenz der SEQ ID NO.: 27 ist. Vorzugsweise ist die 
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Sequenz zu mindestens 60% identisch mit der SEQ ID NO.: 27. Starker bevorzugt 1st 
die Sequenz zu mindestens 65% identiscli mit der Sequenz der SEQ ID NO.: 27. 
Noch starker bevorzugt ist die Sequenz zu mindestens 70% oder 75% identisch mit 
der SEQ ID NO.: 27, Besonders bevorzugt ist die Sequenz zu mindestens 80%, 85%, 
90%, 95%, 98% Oder 99% Identisch mit der Sequenz der SEQ ID NO,: 27. Des 
weiteren umfasst ist die Sequenz der SEQ ID NO.: 28 oder eine Sequenz, die zu 
mindestens 75% identisch mit der Sequenz der SEQ ID NO.: 28 ist. Vorzugsweise ist 
die Sequenz zu mindestens 80% identisch mit der SEQ ID NO.: 28. Starker 
bevorzugt ist die Sequenz zu mindestens 85% identisch mit der Sequenz der SEQ ID 
NO.: 28. Noch starker bevorzugt ist die Sequenz zu mindestens 90%, 95%, 98% 
Oder 99% identisch mit der SEQ ID NO.: 28. Ebenfalls umfasst Ist die Sequenz der 

• SEQ ID NO.: 29 oder eine Sequenz, die zu mindestens 55% identisch mit der 
Sequenz der SEQ ID NO.: 29 ist. Vorzugsweise ist die Sequenz zu mindestens 60% 
identisch mit der SEQ ID NO.: 29. Starker bevorzugt ist die Sequenz zu mindestens 
65% identisch mit der Sequenz der SEQ ID NO.: 29. Noch starker bevorzugt ist die 
Sequenz zu mindestens 70% oder 75% identisch mit der SEQ ID NO.: 29. Besonders 
bevorzugt ist die Sequenz zu mindestens 80%, 85%, 90%, 95%, 98% oder 99% 
identisch mit der Sequenz der SEQ ID NO.: 29. Ferner umfasst ist die Sequenz der 
SEQ ID NO.: 30 oder eine Sequenz, die zu mindestens 60% identisch mit der 
Sequenz der SEQ ID NO.: 30 ist. Vorzugsweise ist die Sequenz zu mindestens 65% 
identisch mit der SEQ ID NO.: 30. Starker bevorzugt ist die Sequenz zu mindestens 
70% identisch mit der Sequenz der SEQ ID NO.: 30. Noch starker bevorzugt ist die 

• Sequenz zu mindestens 75% oder 80% identisch mit der SEQ ID NO.: 30. Besonders 
bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 99% identisch 
mit der Sequenz der SEQ ID NO.: 30. Des weiteren umfasst ist die Sequenz der SEQ 
ID NO.: 31 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz der 
SEQ ID NO.: 31 ist. Vorzugsweise ist die Sequenz zu mindestens 60% identisch mit 
der SEQ ID NO.: 31. Starker bevorzugt ist die Sequenz zu mindestens 65% oder 
70% identisch mit der Sequenz der SEQ ID NO.: 31. Noch starker bevorzugt ist die 
Sequenz zu mindestens 75% oder 80% identisch mit der SEQ ID NO.: 31 . Besonders 
bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 99% identisch 
mit der Sequenz der SEQ ID NO.: 31. Ebenfalls umfasst ist die Sequenz der SEQ ID 
NO.: 32 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz der 
SEQ ID NO.: 32 ist. Vorzugsweise ist die Sequenz zu mindestens 60% identisch mit 
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der SEQ ID NO.: 32. Starker bevorzugt ist die Sequenz zu mindestens 65% oder 
70% identisch mit der Sequenz der SEQ ID NO.: 32. Noch starker bevorzugt ist die 
Sequenz zu mindestens 75 % oder 80% identisch mit der SEQ ID NO.: 32. 
Besonders bevorzugt ist die Sequenz zu mindestens 85%, 90%, 95%, 98% oder 
99% identisch mit der Sequenz der SEQ ID NO.: 32. Des weiteren umfasst ist die 
Sequenz der SEQ ID NO.: 33 oder die Sequenz der SEQ ID NO.: 34. Die genannten 
und durch SEQ ID's gekennzeichneten Aminosauresequenzen warden vorzugsweise 
durch die mit den SEQ ID Nummern 35 bis 68 bezeichneten DNA-Sequenzen 
kodiert. Bevorzugt sind ferner Polypeptide, die den natQrlich vorkommenden 
Enzymen in voller Lange entsprechen. In elner anderen bevorzugten 
AusfQhrungsform enthalten die erfindungsgemaRen Polypeptide daruber hinaus 

• mindestens eineh heterologen AminosSureabschnitt, der diese Polypeptide als 
Fusionsproteine kennzeichnet. Heterologe Bestandteile des erfindungsgema&en 
Fusionsprotelns kSnnen beispielsweise Tags (z. B. His-Tag oder Flag-Tag) sein, die 
bei der Aufreinigung der erfindungsgemaUen Fusionsproteine eingesetzt werden 
kdnnen. In anderen AusfQhrungsformen kdnnen die heterologen Bestandteile eine 
eigene enzymatische AktivitSt aufweisen. In einem derartigen Fall sind die beiden 
enzymatischen Komponenten vorzugsweise durch einen Linker wie einen flexiblen 6- 
10 Aminosaure langen Glycin oder Glycin-Serin Linker verbunden, um die 
Funktionalitat der Komponenten zu gewahrleisten. Wie hier verwendet, kann der 
Begriff „heterolog" einerseits bedeuten, dass die Komponenten des Fusionsprotelns 
naturiicherweise nicht zusammen kovalent verbunden vorkommen, andererseits, 

• dass die Komponenten aus verschiedenen Spezies stammen. Fusionsproteine 
werden Qblicherweise durch rekombinante DNA-Technologie hergestellt (siehe 
Sambrook et al., a.a.O.). 

Der Begriff ..Polypeptid mit der biologischen Aktivitat einer NAD- oder NADP- 
abhangigen Alkoholdehydrogenase" bezeichnet erfindungsgemaB eine Gruppe von 
Enzymen, die die Umwandlung von Alkoholen in Aldehyde bzw. Ketone bzw. die 
entsprechende umgekehrte Reaktion, also die Umwandlung von Aldehyden in 
primare Alkohole bzw. Ketone in sekundare Alkohole, katalysiert. Die erstgenannte 
Reaktion entspricht dabei einem oxidativem ProzeS, der zweitgenannte Reaktlonstyp 
ist ein reduktiver ProzeB. Die EC-Nummer von Alkoholdehydrogenasen (ADHs) ist 
EC 1.1.1.1. Neben den natUriichenveise auftretenden und im Zuge dieser Erfindung 
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isolierten Enzymen sind vom Schutzumfang der Erfindung auch solche Polypeptide 
umfasst, die die vorsteliend genannten Identltatswerte auf Aminosaureebene im 
Vergleicli zu den aus natQrIiclien Quellen isolierten Polypeptiden aufweisen. Diese 
konnen ebenfalls aus natQrIichen Quellen stamnnen. Andererseits konnen sle durch 
rekombinante DNA-Technologie dergestalt verandert warden, dass fur den 
Fachmann vorhersehbar die enzymatische Aktivitat erhalten oder im wesentlichen 
erhalten bleibt (vgl. beispielsweise Sambrook et al, „Molecular Cloning, A Laboratory 
Handbook", 2. Auflage 1989, CSH Press, Cold Spring Harbor, Ausubel et al. „Current 
Protocols In Molecular Biology", John Wiley & Sons, NY 2001). So konnen 
AminosSuren, die sich nicht im aktiven Zentrum befinden und von denen prima facie 
nicht enA/artet wird, dass der Austausch durch eine „gleichartige" AminosSure zu 
einer wesentlich veranderten dreidimensionalen Struktur fQhrt, durch eine 
„gleichartige" Aminosaure ausgetauscht werden. Beispielsweise kann erwartet 
werden, dass bestimmte Aminosauren mit nicht poiaren Seitenketten (gleichartige 
AminosSuren), z.B. Alanin durch Valin, ausgetauscht werden konnen, ohne das dies 
einen (wesentlichen) Einfluss auf die biologische Funktion des Enzyms, im Sinne der 
Erfindung auf die enzymatische Aktivitat hatte. Auf der Basis seines Fachwissens 
kann der Fachmann entsprechende Schlussfolgerungen auch fur den Austausch 
anderen Aminosaurearten (zum Beispiel den Ersatz basischer Aminosauren durch 
andere basische Aminosauren oder von Aminosauren mit ungeladenen poiaren 
Seitenketten durch andere Aminosauren aus dieser Gruppe) erstellen. 

Die prozentuale Identitat zu den Aminosauresequenzen der aus natQrIichen Quellen 
isolierten Polypeptiden, die in dieser Beschreibung durch SEQ ID Nummern 
beschrieben sind, kann mit im Stand der Technik bekannten Verfahren vom 
Fachmann ohne weiteres ermittelt werden. Ein geeignetes Programm, das 
erfindungsgema(2> eingesetzt werden kann, ist BLASTP (Altschul etaL. 1997. Gapped 
BLAST and PSI-BLAST: a new generation of protein database search programs. 
Nucleic Acids Res. 25(17):3389-3402.). 

Ferner betrifft die Erfindung ein Nukleinsauremolekul, das das erfindungsgemSSe 
Polypeptid kodiert. 

Das erfindungsgemaSe Nukleinsauremolekul kann ein DNA- oder ein RNA-Molekul 
sein. Bevorzugt ist, dass das Nukleinsauremoiekul ein cDNA- oder ein mRNA- 
Molekul ist. ErfindungsgemaB kann das DNA-Molekul des weiteren ein genomisches 
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DNA-MolekQI sein. Ferner umfasst von der Erfindung sind AusfQhrungsformen, in 
denen das DNA-MolekQI ein PNA-MolekQI oder ein anderes Derivat eines DNA- 
MolekQIs 1st. Bevorzugt sInd erfindungsgemaB DNA-Sequenzen, die die DNA- 
Sequenzen gemaB den SEQ ID Nummern 35 bis 68 umfassen. 

Zur Losung des der Erfindung zugrunde liegenden technischen Problems wurde der 
folgende Ansatz verfolgt. Auf Basis einer umfangreichien proprietaren 
Stammsammlung erfolgte zunachst die Anzucht priorisierter Stamme auf Platte und 
nach erfolgter ViabilitSts- und Reinheitskontrolle auch in Flussigkultur. Aus den 
geernteten Zellpellets wurde die genomische DNA dieser Organismen isoliert. Auf 
Basis der prSparierten genomischen DNA wurde mittels erfindungsgemaRer Primer 
das genetisciie Screening ausgewShlter Isolate auf Alkoiioldehydrogenase-Gene via 
PCR-Typisierung durchgefQhrt. Auch die Homologie-bedingte 
AminosSuresequenzSiiniichkeit bereits bekannter Alkoholdehydrogenasen eriaubte 
dabei nicht ohne weiteres das Ableiten von Oligonukleotid-Primern, mit deren Hilfe 
bisher nicht identifizierte Alkoholdehydrogenase-Gene ohne weiteres erfolgreich 
amplifiziert werden konnen. Zunachst beruhte dieser Ansatz auf der Hypothese, dass 
bestimmte, in den bisher bekannten Alkoholdehydrogenase-Genen konservierte 
Sequenzmotive auch In den gesuchten neuen Alkoholdehydrogenase-Genen 
vorhanden sind. Die in den bisher bekannten Alkoholdehydrogenase-Genen 
konservierten Sequenzmotive sind jedoch ungeeignet, um iiber dem Fachmann 
bekannte Veriahren (Kwok et al.. 1995. Design and use of mismatched and 
degenerate primers. In: PGR Primer , A laboratory Manual, Dieflenbach CW & 
Dveksler GS (Editors), Cold Spring Habor Laboratory Press, pp 143-1 55; Compton T. 
1990. Degenerate Primers for DNA Amplification. In: PGR Protocols, A Guide to 
Methods and Applications. Innis et ai. (Editors) Academic Press, San Diego, pp39- 
34) degenerierte Primer abzuleiten. Die NAD- oder NADP-abh§ngigen 
Alkoholdehydrogenasen werden in langkettige, mittellange und kurzkettige ADHs 
eingeteilt. Sie werden vor allem auf Basis ihrer Metallabhangigkeit und der GroSe der 
Untereinheiten in diese drei Gruppen eingeteilt. Die kurzkettigen ADHs benotigen 
keine Metall-lonen und ihre Untereinheiten bestehen in etwa aus 250 Aminosauren. 
Die mittellangen und langkettigen ADHs sind dagegen von Metall-lonen abhangig. 
Die mittellangen, deren typische Untereinheiten aus ca. 350 Aminosduren bestehen, 
benotigen Zink-lonen. Die langkettigen ADHs, deren Untereinheiten aus ca. 385 
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Aminosauren zusammengesetzt sind, benStigen Eisen-lonen (Hummel, W. 1997. 
New alcohol dehydrogenases for the synthesis of chiral compounds. 58:145-84). Die 
Sequenzheterogenitat nicht nur innerhalb aller bisher bekannten NAD- oder NADP- 
abhangigen ADHs ist ausgesprochen groB sondern auch die Sequenzheterogenitat 
innerhalb der drei oben kurz beschriebenen ADH-Gruppen. Daher war es nicht ohne 
weiteres einfach, Primer zu konstruieren, mit Hilfe derer zum einen spezifisch ADH- 
Sequenzen amplifiziert werden konnen, und zum anderen auch eine zur Losung der 
Aufgabe notwendlge Diversitat an neuartigen ADHs erfal^t werden kann. So wurden 
In den untersuchten Bakterien trotz des auf der Basis der verwendeten erwarteten 
Sequenzhomologien keinerlei neue langkettige ADHs isoliert. Die Qualit3t der 
konstruierten Primer sollte dabei zunachst mlt genomlscher DNA von 

• Modellorganismen, deren Alkoholdehydrogenase-Gene bekannt sind oder mit DNA- 
Pools bestehend aus DNA aus verschledenen Mikroorganismen ausgetestet werden. 
Dabei wurden PCR-Produkte kloniert, sequenziert und anschlieRend analysiert. Nach 
dieser Etablierungsphase wurde auf Basis der praparierten genomischen DNA der zu 
screenenden Mikroorganismen, wie oben beschrieben, eine PCR-Typisierung 
ausgewahlter Isolate durchgefuhrt. Die aus den Experimenten gewonnenen 
Ergebnissen (zur Sequenzidentitat und spezifischen Aktivitat) flossen in die 
Priorisierung der potentiellen Hit-Organismen ein, deren neuartige 
Alkoholdehydrogenase-Gene isoliert werden. Trotz der unenvarteten, 
enttauschenden und demotivierenden Ergebnissen bei der versuchten isolierung yon 
Nukleinsauren, die langkettige ADHs kodieren sollten, wurde erfindungsgemaH eine 

• Reihe an Nukleinsauren isoliert, die kurzkettige Enzyme und mittellange 
Enzymketten kodieren. Diese wiesen z. T. eine erstaunlich niedrige Sequenzidentitat 
(<50%) mit den bekannten Enzymen aus dieser Klasse auf. 

Des weiteren betrifft die Erfindung ein NukleinsSuremolekQI, das komplementar zu 
dem erfindungsgemaBen Nukleinsauremolekul ist. 

Der Begriff „komplementar*' bedeutet erfindungsgemaS, dass sich die 
Komplementaritat uber den gesamten Bereich des erfindungsgemaSen 
Nukleinsauremolekuls ohne Lucken erstreckt. Mit anderen Worten ist es 
erfindungsgemaR bevorzugt, dass die Komplementaritat sich zu 100% uber den 
gesamten Bereich der erfindungsgemaSen Sequenz, d.h. vom dargestellten 5'-Ende 
bis zum dargestellten 3'-Ende erstreckt. In weiteren bevorzugten AusfQhrungsformen 
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erstreckt sich die Komplementaritat Qber einen Bereich von mindestens 19, 
bevorzugt mindestens 21 aufeinanderfolgenden Nul<leotiden, die bevorzugt nicht fQr 
das alctive Zentrum der enzymatisclien AktivitSt i^odieren. 

DarQber hinaus betrifft die Erfindung einen Velctor, der das erfindungsgemaRe 
Nui<leinsauremolekul enthalt. 

In den erfindungsgemaBen Vel<toren liegen die erfindungsgemaSen Nukleinsauren 
bevorzugt in operativer VerknDpfung mit einer Expressionskontrollsequenz vor, so 
dass sie in einer geeigneten Wirtszelle transkribiert und gegebenenfalis translatiert 
werden kOnnen. Expressionskohtrollsequenzen umfessen Qbliclienweise einen 
Promotor und gegebenenfalis weitere regulatorische Sequenzen wle Operatoren 

• Oder Enhancer. Weiterhin kSnnen auch Translations-lnitlationssequenzen vorhanden 
sein. Geelgnete Expressionskontrollsequenzen fQr prokaryontische oder 
eukaryontische Wirtszellen sind dem Faclimann bekannt (siehe z.B. Sambrook et al., 
a.a.b.). Der erfindungsgemaUe rekombinante Vektor kann weiterhin noch Qbliche 
Elemente wie einen Replikationsursprung und ein Selektionsnnarkergen enthalten. 
Beispiele fur geeignete rekombinante Vektoren sind Plasmide, Cosmide, Phagen, 
Oder Viren (siehe z.B. Sambrook et al., supra). Ausgangsmaterialien fQr die 
Herstellung der erfindungsgemaBen rekombinanten Vektoren sind kommerziell 
erhaltlich (z.B. von den Firmen Stratagene, InVitroGen oder Promega). 
Alle dem Fachmann fQr diesen Zweck zur Verfugung stehenden Plasmide oder 
Vektoren kommen im Prinzip in Frage. Derartige Plasmide und Vektoren konnen z. 

• B. von Studier und Mitarbeiter (Studier. W. F.; Rosenberg A. H.; Dunn J. J.; 
Dubendroff J. W.; (1990), Use of the T7 RNA polymerase to direct expression of 
cloned genes. Methods Enzymol. 185, 61-89) oder den BroschQren der Firmen 
Novagen, Promega, New England Biolabs, Clontech oder Gibco BRL entnommen 
werden. Welter bevorzugte Plasmide und Vektoren kOnnen gefunden werden In: 
Glover, D. M. (1985), DNA cloning: a practical approach. Vol. I-III, IRL Press Ltd., 
Oxford; Rodriguez, R.L. und Denhardt, D. T (eds) (1988), Vectors: a sun^ey of 
molecular cloning vectors and their uses, 179-204, Buttenworth, Stoneham; Goeddel, 
D. V. (1990), Systems for heterologous gene expression, Methods Enzymol. 185, 3- 
7; Sambrook, J.; Fritsch, E. F. und Maniatis, T. (1989), Molecular cloning: a 
laboratory manual, 2nd ed.. Cold Spring Harbor Laboratory Press, New York. 
Plasmide, mit denen das die erfindungsgemaSe Nukleinsaure aufweisende 
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Genkonstrukt In ganz bevorzugter Weise in den Wirtsorganismus kloniert werden 
kann, sind Derlvate von: pUC18 und pUC19 (Roche Biochemicals), pKK-177-3H 
(Roche Biochemicals), pBTac2 (Roche Biochemicals), pKK223-3 (Amersham 
Pharmacia Biotech), pKK-233-3 (Stratagene) oder pET (Novagen). Weitere 
bevorzugte Plasmide sind pBR322 (DSM3879), pACYC184 (DSM4439) und pSC101 
(DSM6202), welche von der DSMZ-Deutsche Sammlung von Mikroorganlsmen und 
Zellkulturen GmbH, Braunschweig, Germany bezogen werden konnen. Bevorzugte 
Promotoren sind beispielswelse T7, lac, tac, trp, rha und ara. 

Ferner betrlfft die ErRndung einen nicht-menschlichen Wirt, der das 
erflndungsgem3&e Poiypeptid oder das erfindungsgema&e Nukleins3uremblekQi 

•Oder den erflndungsgemS&en Vektor enthSlt. 
Der nicht-menschliche Wirt kann eine Zelle oder ein mehr- bis vielzelliger 
Organismus seln. Geeignete vielzelilge Organismen schlle&en In der 
Molekularblologie gelaufige Modelisysteme wie Drosophlla meianogaster, Zebrafisch 
Oder C. elegans ein. 

in einer bevorzugten Ausfuhrungsform ist der Wirt eine Zelle. 

Der erfindungsgemaSe Wirt ist in dieser bevorzugten Ausfuhrungsform eine 
rekomblnante Zelle, die mit einer erfindungsgemd&en Nukleinsaure oder einem 
erflndungsgemSfien Vektor transformiert oder transflziert wurde (die Begrlffe 
„Transfomiation" und „Transfektion" werden gemSB dieser Erfindung sinngleich 

•verwendet). Die Transformation bzw. Transfektlon kann nach bekannten l\^ethoden 
erfolgen, z.B. durch Calciumphosphat-Coprdzipitation, LIpofektion, Elektroporation, 
Partikelbeschull oder viraie Infektlon. Die erfindungsgemd&e Zelle kann die 
rekomblnante Nukleinsdure in extrachromosomaler oder chromosomal Integrierter 
Form enthalten. Mit anderen Worten kann die Transfektlon/Transformation eine 
stabile oder transiente Transfektion/Transformation sein. 

Vorzugsweise ist die rekombinante Zelle prokaryotischen Ursprungs. Geeignete 
Wirtszellen schlleSen Zellen von einzelligen Mikroorganlsmen wie bakterlelie Zellen 
ein: Als bakterlelles Wirtssystem eignet sich insbesondere E. coll. E. coli weist im 
Zytoplasma die Cofaktoren auf, die fQr die enzymatische Aktivitat des 
erfindungsgema&en Polypeptids benOtlgt werden. Dies sind Insbesondere NADH, 
NADPJH, NAD* oder NADP*. Ganz besonders bevorzugt sind: E. coll XL1 Blue, 
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W3110, DSM14459 (PCT/USOO/08159), NM 522. JM101, JM109, JM105, RR1, DH5, 
TOP 10- Oder HB101. Ferner konnen Bakterien der Genera/Spezies Lactobacillus, 
Bacillus, Rhodococus, Campylobacter, Caulobacter, Mycobacterium, Streptomyces, 
Neisseria, Ralstonia, Pseudomonas, sowie Agrobacterium fur die Expression der 
erfindungsgemaBen Nukleinsauren eingesetzt werden. Entsprechende Stamme sind 
im Stand der Technik verfQgbar und konnen, zumindest teilweise, uber die 
internationalen Hinterlegungsstellen wie die ATCC oder die DMSZ bezogen werden. 
Transfektions- und Transformations-Protokolle sind dem Fachmann bekannt (Chan 
and Cohen. 1979. High Frequency Transformation of Bacillus subtilis Protoplasts by 
Palsmid DNA. Mol Gen Genet. 168(1):111-5; Kleser et aL 2000, Practical 
Streptomyces Genetics. The John Innes Foundation Norwich.; Sambrook et aL 

• 1989. Molecular Cloning. A Laboratory Manual. In: second ed.. Cold Spring Harbor 
Laboratory Press. Cold Spring Harbor. NY.; Irani and Rowe. 1997. Enhancement of 
transformation in Pseudomonas aeruginosa PA01 by Mg^* and heat. Biotechniques 
22: 54-56). DarQberhlnaus kSnnen als Wirtsorganismen beispielsweise auch Hefen 
wie Hansenula polymorpha, Pichia sp., Saccharomyces cerevisiae herangezogen 
werden. 

Alternativ dazu kann die Zelle eukaryontischen Ursprungs sein. Geeignete 
eukaryontische Zellen schlieBen CHO-Zellen, HeLa-Zellen und andere ein. Viele 
dieser Zellen sind uber Hinterlegungsstellen wie die ATCC oder die DMSZ erhaltlich. 

• In einer weiteren bevorzugten Ausfuhrungsform ist der Wirt eIn transgenes nicht- 
menschliches Tier. 

Transgene nicht-menschllche Tiere k5nnen nach im Stand der Technik bekannten 
Verfahren hergestellt werden. 

Das erfindungsgemaBe transgene nicht-menschliche Tier kann bevorzugt 
verschiedene genetische Konstitutionen aufweisen. Es kann (i) das Gen einer 
erfindungsgemaSen Nukieinsaure konstitutiv oder induzierbar uberexprimieren, (ii) 
das endogene Gen einer erfindungsgemaSen Nukieinsaure in inaktivierter Form 
enthalten, (iii) das endogene Gen einer erfindungsgemaSen Nukieinsaure vollstandig 
Oder teilweise durch ein mutiertes Gen einer erfindungsgema&en Nukieinsaure 
ersetzt enthalten, (iv) eine konditionale und gewebsspezifische Oberexpression oder 
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Unterexpression des Gens einer erfindungsgemaSen Nukleinsaure aufweisen oder 
(v) einen konditionalen und gewebsspezifischen Knock-out des Gens einer 
erfindungsgema&en Nukleinsaure aufweisen. 

Vorzugsweise enthalt das transgene Tier zusatzlich ein exogenes Gen einer 
erfindungsgemaUen Nukleinsaure unter Kontrolle eines die Oberexpression 
eriaubenden Promotors. Alternativ kann das endogene Gen einer 
erfindungsgemaRen Nukleinsaure durch Aktivierung oder/und Austauscli des 
eigenen Promotors Qberexprimiert werden. Vorzugsweise waist der endogene 
Promotor des Gens einer erfindungsgemaRen Nukleinsaure eine genetische 
Veranderung auf, die zu einer erhohten Expression des Gens fQhrt. Die genetische 

• VerSnderung des endogenen Promotors umfasst dabei sowohl eine Mutation 
einzelner Basen als auch Deletions- und Insertionsmutationen. 

In einer besonders bevorzugten AusfQhrungsform des erfindungsgemaRen Wirts ist 
dieser ein transgener Nager, vorzugsweise eine transgene Maus, ein transgenes 
Kaninchen, eine transgene Ratte, oder ein transgenes Schaf, eine transgene Kuh, 
eine transgene Ziege oder ein transgenes Schwein. 

Mause haben gegenuber anderen Tieren zahlreiche Vorteile. Sie sind leicht zu halten 
und ihre Physiologie gilt als Modellsystem fQr die des Menschen. Die Herstellung 
solcher Gen-manipulierten Tiere ist dem Fachmann hinreichend bekannt und wird 
nach Qblichen Verfahren durchgefQhrt (sh. z.B. Hogan, B., Beddington, R.. 

• Costantini, F. und Lacy, E. (1994), Manipulating the Mouse-Embryo; A Laboratory 
Manual, 2. Aufl., Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; 
WO91/08216). 

Alternativ oder zusatzlich konnen auch Zellkultursysteme, insbesondere humane 
Zellkultursysteme, fur die Anwendungen eingesetzt werden, die fQr das 
erfindungsgemaSe nicht-menschliche transgene Tier beschrieben sind. 

Als Cofaktoren der Alkoholdehydrogenasen werden - wie bereits vorstehend 
enA^ahnt, in Abhangigkeit von der jeweiligen Alkoholdehydrogenase - beispielsweise 
NADH bzw. NADPH bzw. deren oxidierte Fomnen NAD* und NADP" eingesetzt. 
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Die Regeneration der Cofaktoren Icann im Prinzip entweder enzymgekoppeit unter 
Einsatz eines zweiten Enzyms, beispielsweise einer Formiatdelnydrogenase oder 
einer Glucosedehydrogenase, oder substratgekoppelt unter Einsatz elnes von der 
eingesetzten Alkoholdehydrogenase als Substrat akzeptierten Alkohois, 
beispielsweise - falls als Substrat akzeptiert - /so-Propanol, erfolgen. Exemplarisch 
ist im nachfolgenden Schema das Konzept der Alkoholdehydrogenase-katalysierten 
Reduktion eines Ketons mit einer enzymgekoppelten Cofaktorregenerierung unter 
Einsatz einer Formiatdehydrogenase aufgezeigt. 



O 




(R)-oder(S)- 
Alcohol 

• Alkoholdehydrogenasen werden beispielsweise zur Herstellung von 
enantiomerenangereicherten, vorzugsweise enantiomerenreinen sekundaren 
Alkoholen ausgehend von prochiralen Ketonen eingesetzt. Dabei sind sowohl (R)- 
als auch (S)-spezifische Alkoholdehydrogenasen bekannt, die entsprechend zur 
Ausblldung der jeweiligen enantiomeren (R)- bzw. der (S)-Form von Alkoholen 
fQhren. 

Dementsprechend ist erfindungsgemaS auch ein Wirt bevorzugt, der eine weitere, fOr 
die Cofaktor-Regenerierung geeignete Dehydrogenase oder ein diese 
Dehydrogenase kodierendes Nukleinsauremolekul aufweist. 

Dabei kann der Wirt diese weitere Dehydrogenase naturlicherweise enthalten oder er 
kann mit einer rekombinanten Nukleinsaure, die diese Dehydrogenase kodiert und 
mit der die Dehydrogenase in dem Wirt exprimiert werdeh kann, transfiziert worden 
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sein. Diese AusfUhrungsform setzt auch voraus, dass der Wirt die fQr die Funktion 
dieser weiteren Deliydrogenase notwendigen Cofaktoren aufweist oder dass ihm 
diese Cofaktoren in geeigneter Weise zugefQIirt werden. 

Insbesondere bevorzugt ist in diesem Zusannmenhang ein Wirt, wobei die fQr die 
Cofaktor-Regenerierung geeignete Dehydrogenase eine Formiatdeiiydrogenase oder 
eine Glucosedehydrogenase ist. Besonders bevorzugt ist eine 
Formiatdehydrogenase aus Candida boidinii. Ferner ist besonders bevorzugt, dass 
die cofaktorregenerierende Dehydrogenase eine Glucosedehydrogenase aus 
Bacillus subtilis ist Gentechnisch verSnderte Mutanten der genannten 
cofaktorregenerierenden Dehydrogenasen, die die genannte enzymatische Funktion 
^l^beibehalten, sind erfindungsgema& ebenfalis bevorzugt. 

In einer weiteren AusfUhrungsform betrifft die Erfindung ein Reaktionssytenn, das 
eine ein Substrat einer Dehydrogenase darstellende organische Verbindung enthait, 
femer das erfindungsgemaRe Polypeptid, den erfindungsgemSBen Veictor oder den 
erfindungsgemaSen Wirt und gegebenenfalls einen Gofaktor fQr das 
erfindungsgemS&e Polypeptid. (Cofaktor-Zugabe ist in den Fallen nStig, In denen der 
Gofaktor nicht schon Im System vorhanden Ist, siehe auch unten) Das 
erfindungsgemaBe Reaktlonssystem kann in einem Falle eine bakterielle Zelle sein, 
die dem erfindungsgemaBen Wirt entspricht und das erfindungsgemaBe Polypeptid 

• sowie die notwendigen Cofaktoren im Zytoplasma aufweist. In dem Falle, dass 
der/die Cofaktor(en) bereits naturlicherweise im System/Wirt vorhanden sind, 
mQssen sie nicht mehr gesondert zugefuhrt werden. Geeigneterweise ist der Wirt ein 
solcher, der eine weltere, fur die Cofaktor-Regenerierung geeignete Dehydrogenase 
Oder ein diese Dehydrogenase kodierendes NukleinsauremolekQI aufweist und ferner 
die dazu notwendigen Cofaktoren. Wenn diesem Reaktionssytem ein Substrat fQr ein 
gewQnschtes Produkt zugefQhrt wird oder dieses im Reaktlonssystem selbst 
metabolisiert wird. so kann das gewQnschte Produkt ohne weiteres aus dem 
Reaktlonssystem Isoliert werden, wenn das Reaktlonssystem unter geeigneten 
Bedingungen gehalten wird. Geeignete Bedlngungen schlleBen ein, dass die 
Reaktion bei Temperaturen von 10 bis SCC, bevorzugt von 20 bis 60°C, und ganz 
bevorzugt von 20 bis 40°C durchgefQhrt wird. Bevorzugt ist auch, dass die 
Substratkonzentration bei 100 bis 2000 miy/l, vorzugsweise bei 200 bis 800 mM liegt. 
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In bevorzugter Form wird die gewQnschte Reaktlon so durchgefQhrt, dass Umsatze 
von >80%, insbesondere >90%, innerhalb von <20 Stunden Reaktlonszeit, 
insbesondere <10 Stunden Reaktionszelt und ganz bevorzugt <5 Stunden 
Reaktionszeit erreicht werden. Das Reaktionssytem kann in einer anderen 
Ausfuhrungsform ein in vitro System zur Umsetzung eines geeigneten Substrats zum 
Erhalt des gewunschten Produktes sein. Beispielsweise kann das erfindungsgemaSe 
Polypeptid mit den genannten Cofaktoren und dem Substrat und gegebenenfalls 
(d.h. sofern notig) mit einer weiteren, fur die Cofaktor-Regenerierung geeigneten 
Dehydrogenase (und gegebenenfalls dafur notwendigen Cofaktoren, Insbesondere 
NADH und NADPH bzw. deren oxidierte Formen) unter geeigneten Bedingungen, 
wie beispielsweise vorstehend ausgefuhrt und fur einen ausreichenden Zeitraum in 

• Kontakt gebracht werden, so dass das gewQnschte Produkt entstehen kann. Bei 
dieser in vitro-Variante unter Nutzung von isolierten Enzymen (In gereinigter Form 
Oder als Rohextrakt) und Zusatz von Cofaktoren sollten diese Cofaktorzusatze im 
Sinne einer okonomischen ProzessfQhrung bei <0.01 Aquivalenten (bezogen auf die 
eingesetzte Substratmenge), bevorzugt <0.001 Aquivalenten und ganz bevorzugt 
<0.0005 Aquivalenten liegen. 

Ferner kann das „Reaktionssytem" auch ein transgenes nicht-menschliches Tier sein, 
dem ein geeignetes Substrat und gegebenenfalls Cofaktoren oder/und die weitere 
Dehydrogenase gefuttert Oder verabreicht wird und das das Substrat in geeigneten 
Geweben umsetzen kann. Das Reaktionssystem kann in einer anderen 
Ausfuhrungsform auch ein zellulSres Membransystem sein, in dem das Enzym, die 
Enzyme und ggf. die Cofaktoren verankert sind. 

Bevorzugt ist erfindungsgemaU ferner ein Reaktionssytem, bei dem die ein Substrat 
einer Dehydrogenase darstellende organische Verbindung eine Carbonylverbindung 
ist. 

Besonders bevorzugt ist ein Reaktionssystem, bei dem die Carbonylverbindung eine 
Aldehyd Oder ein Keton ist. 

Diese AusfQhrungsform der Erfindung eriaubt die erfindungsgemaR besonders 
bevorzugte Herstellung von technischen Alkoholen, die beispielsweise als 
Zwischenprodukte fQr die Herstellung von in Arzneimittein einsetzbaren Wirkstoffen 
dienen konnen. 
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Besonders bevorzugt ist erfindungsgemaS, dass das Keton ein unsymmetrisch 
substituiertes Keton ist. 

Diese AusfQhrungsform der Erfindung ist deshalb besonders bevorzugt, weil die bei 
einer entsprechenden Reduktlon entstehenden Produkte ein Chiraiitatszentrum 
aufweisen und mit Inolier Enantioselei<tivitat eriialten werden konnen. Im Allgemeinen 
werden die gewUnscliten chiralen sekundaren Alkolnole in enantiomerenreiner Form 
mit einem EnantiomerenQbersohuS von >99% ee eriialten. 

In einer anderen bevorzugten AusfQIirungsform des erfindungsgemSRen 
Reaktionssystems ist die ein Substrat einer Deliydrogenase darstellende organische 

• Verbindung ein Alkohol. Diese Variante eignet sicli bevorzugt zur Herstellung von 
kommerziell bedeutenden Carbonylverbindungen, beispielsweise Ketone mit 
Relevanz im Bereich der Aromachemikalien. Daneben kann die Oxidation aucli zur 
Ausbildung von enantiomerenreinen, sekundaren Alkoholen lierangezogen werden, 
indem man von einem racemisclien Alkohol als Substrat ausgeiit und durcli 
enantioselektive Oxidation das unerwunschte Enantiomer in die Ketonverbindung 
QberfQIirt. Das zurOckbleibende, gewiinschte Enantiomer kann dann entsprechend 
isoliert werden. 

Vorzugsweise ist der Alkoliol ein primSrer Alkoliol oder ein cliiraler sekundarer 
Alkohol. In ersterem Fall entsteht ein Aldehyd als Produkt, wohingegen im zweiten 
Fall die entsprechenden Ketone gebildet werden. 

ErfindungsgemaB ist auch bevorzugt, dass der Gofaktor im erfindungsgem§Ben 
Reaktionssystem NADH, NADPH. NAD* oder NADP* ist. 

Ferner betrifft die Erfindung ein Verfahren zur Herstellung des erfindungsgemSBen 
Polypeptids oder eines durch das erfindungsgemaBe NukleinsauremolekQI kodierten 
Polypeptids, wobei man den erfindungsgemaBen Wirt zQchtet und das Polypeptid 
isoliert. 

Das Polypeptid kann beispielsweise nach konventionellen Verfahren, beispielsweise 
nach AufschluB entsprechender Zellen, beispielsweise vermittels einer „French- 
Press", durch lonenaustausch, GrOBenseiektion oder Affinitatschromatographie etc. 
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aufgereinigt werden (Coligan et al.. Current Protocols in Protein Science, John Wiley 
&Sons, Inc.). Altemativ dazu kann das erfindungsgennaBe Polypeptid, wenn 
verknQpft mit einem Leader-Peptid, aus den Zellen ausgeschleust und aus dem 
Kulturuberstand aufgereinigt werden. Diese AusfCihrungsform bedingt, dass das 
natQrIichenweise nicht mit einem Leader-Peptid versehene erfindungsgemaSe 
Polypeptid genteciinisch verandert wird. Vorteilliaft an dieser AusfCihrungsform ist die 
einfachere Aufreinigung des erfindungsgemaSen Polypeptids aus dem 
KulturQberstand. Die besten Verfahrensablaufe und geeignete Leader-Peptide 
kdnnen vom Fachmann ohne weiteres ermittelt werden. 

In einer weiteren bevorzugten AusfDhrungsform des erfindungsgemSften Verlahrens 

•wird das Polypeptid aus einer KSrperflQssigkeit oder Gewebeprobe des nicht- 
menschlichen transgenen Tiers isoliert. Auch in dieser AusfDhrungsform ist das 
erfindungsgemaBe Polypeptid vorzugsweise mit einem Leader-Peptid versehen. 

In einer weiteren bevorzugten AusfDhrungsform des erfindungsgemSRen Verfahrens 
und insbesondere wenn das nicht-menschliche transgene Tier ein SSugetier, 
beispielsweise eine Kuh, eine Ziege oder ein Schaf ist, ist die KorperflQssigkeit Milch 
Oder Serum. 

In einer anderen AusfQhmngsfonn betrifft die Erfindung ein Verfahren zur Herstellung 
einer ein Produkt einer Dehydrogenase darstellenden organischen Verbindung, 

•wobei man eine ein Substrat einer Dehydrogenase darstellende organische 
Verbindung mit dem erfindungsgemSBen Polypeptid, dem erfindungsgemaSen Wirt 
Oder mittels des erfindungsgemaBen Reaktionssystems umsetzt. 
Die verschiedenen im erfindungsgemaBen Verfahren einzusetzenden 
AusfQhrungsformen der Erfindung unterscheiden sich im Prinzip dadurch, dass zu 
dem Polypeptid, sofern es im zellfreien in vitro System eingesetzt wird, weitere 
Komponenten wie Cofaktoren etc. (vgl. supra) zugesetzt werden mQssen. Bei 
Verwendung des erfindungsgemaBen Reaktionssytems sind die notwendigen 
Komponenten ggf. mit Ausnahme des Substrats, vorzugsweise und vorteiihafter 
Weise bereits im System enthalten, ohne dass es dazu noch eines gesonderten 
Zusatzes bedarf. 
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Bevorzugt ist erfindungsgemaS ein Verfahren, das ferner den Schrltt der Isolierung 
des Produktes der Umsetzung umfasst Geeignete Verfahren zur 
Isolierung/Aufreinigung wurden vorstehend dargestellt. 

In einer besonders bevorzugten Ausfuhrungsform des erfindungsgemalien 
Verfahrens umfasst dieses ferner die Weiterverarbeitung des Produktes in ein 
ArzneimitteL Eine Reihe von Beschreibungen der Nutzung enantiomerenreiner 
Alkohole als Intermediate zur Herstellung von Pharmawirkstoffen ist in der Literatur 
gegeben. Eine diesbezQgliche Obersiclit ist u.a. entlialten in: A. Kleemann, J. Engels, 
B. Kutsclier, D. Reicliert, Pliarmaceutical Substances: Syntheses, Patents, 
Applications, 4. Ausgabe, Thieme-Verlag, Stuttgart, 2001. 

In einer anderen besonders bevorzugten AusfQhrungsform des erfindungsgemaUen 
Verfahrens umfasst dieses welter den Schritt der Weiterverarbeitung des Produktes 
in ein Folgeprodukt Dabei kann die Derivatisierung sowohl durch Modifikation der 
Alkoholgruppe, beispielsweise durch Versterung und anschlieSende 
Folgereaktionen, als auch durch Modifikationen der jeweiligen Substituenten 
erfolgen. 

Dabei ist insbesondere bevorzugt, dass das erfindungsgemaSe Verfahren welter den 
Schritt der Formulierung des Folgeproduktes mit einem pharmazeutisch vertraglichen 
_ Trager oder Exzipienten oder VerdQnnungsmittel in der Herstellung eines 
^jpj^ Arzneimittels umfasst. 

Beispiele ftir geeignete pharmazeutisch vertragiiche TrSger und/oder 
VerdQnnungsmittel sind dem Fachmann bekannt und umfassen z.B. Phosphat- 
gepufferte Kochsalzlosungen, Wasser, Emulsionen, wie z.B. OlAA/asser-Emulsionen, 
verschiedene Arten von Netzmittel oder Detergenzien, sterile Losungen, etc. 
Arzneimittel, die solche Trager umfassen, konnen mittels bekannter konventioneller 
Methoden formuliert werden. Diese Arzneimittel konnen einem Individuum in einer 
geeigneten Dosis verabreicht werden. Die Verabreichung kann oral oder parenteral 
erfolgen, z.B. intravenos, intraperitoneal, subcutan, intramuskular, lokal, intranasal, 
intrabronchial, oral oder intradermal, oder Qber einen Katheter an einer Stelle in einer 
Arterie. PrSparate fQr eine parenterale Verabreichung umfassen sterile waBrige oder 



22 



nlcht-walirige Losungen, Suspensionen und Emulsionen. Beispiele fUr nicht-waBrige 
Losungsmittel slnd Propylenglykol, Polyethylenglykol, pflanzliche Ole wie z.B. 
Ollvenol, und organische Esterverbindungen wie z.B. Ethyloleat, die fUr Injektionen 
geeignet slnd. WaBrlge Trager umfassen Wasser, allcoholisch-waBrige LSsungen, 
Emulsionen, Suspensionen, Salzldsungen und gepufferte Pwledien. Parenterale 
Trager umfassen Natriumclilorid-Lesungen, Ringer-Dextrose, Dextrose und 
Natriumchlorid, Ringer-Lalctat und gebundene Ole. Intravenose Trager umfassen z.B. 
Flussigkeits-, Nahrstoff- und Elektrolyt-Erganzungsmittel (wie z.B. solche, die auf 
Ringer-Dextrose basieren. Das Arzneimittel kann auBerdem Konservierungsmittel 
und andere Zusatze umfassen, wie z.B. antimikrobielle Verbindungen, 
Antioxidantien, Komplexbildner und inerte Gase. Des welteren kdnnen, abhangig von 

• der beabsiclitigten spezifischen Venwendung, andere Wirkstoffe wie z.B. Interleuklne, 
Waclistumsfaktoren, Differenzlerungsfaktoren, Interferone, cliemotaktisclie Proteine 
Oder ein unspezifisclies imrnunmodulatorisches Agens entlialten sein. 

Die Art der Dosierung wird vom behandelnden Arzt entspreciiend den klinischen 
Faktoren bestlmmt. Es 1st dem Faclimann bekannt, daS die Art der Dosierung von 
verschiedenen Faktoren abhangig ist, wie z.B. der KorpergroSe bzw. dem Gewicht, 
der KSrperoberflache, dem Alter, dem Geschlecht Oder der allgemeinen Gesundheit 
des Patienten, aber aucii von dem speziell zu verabreichenden Mittel, der Dauer 
und Art der Verabreicliung, und von anderen Medikamenten, die mSglicherweise 
parallel verabreiclit werden. Eine typische Dosis kann z.B. in einem Bereich 

• zwischen 0,001 und 1000 pg liegen, wobei Dosen unterhalb oder oberhalb dieses 
beispielhaften Bereiches, vor allem unter BerUcksichtigung der oben env3hnten 
Faktoren, vorsteilbar sind. Im allgemeinen sollte sich be! regelmSBiger Verabreichung 
der erfindungsgemSSen Zusammensetzung die Dosis in einem Berelcti zwischen 1 
pg- und 10 mg-Einheiten pro Tag befinden. Oblichenweise werden die Wirkstoffe in 
diesen Zubereitungen in einer Konzentration von groSer ais 10 pg/ml eines 
physiologischen Puffers vorliegen. Sie kSnnen aber auch in fester Form in einer 
Konzentration von 0,1 bis 99,5 Gew.% der Gesamtmischung vorhanden sein. Im 
allgemeinen hat es sich als vorteilhaft erwiesen, den oder die Wirkstoffe in 
Gesamtmengen von etwa 0,001 bis 100 mg/kg, bevorzugt in Gesamtmengen von 
etwa 0,01 bis 10 mg/kg Korpergewicht je 24 Stunden, gegebenenfalls als 
Dauerinfusion oder in Form von mehreren Einzelgaben, zur Erzielung des 
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gewQnschten Ergebnisses zu verabreichen. Wird die Zusammensetzung intravenos 
verabreicht, sollte sich die Dosis in einem Bereicin zwisclien 1 |jg- und 10 mg- 
Einlieiten pro Kilogramm Korpergewicht pro Tag befinden. Das Arzneimittel kann 
topisch, lokal oder systemisch verabreiclit werden. 

ErfindungsgemaR ist schlieRlich insbesondere bevorzugt ein Verfaliren, wobei das 
Produkt ein enantiomerreiner Alkolioi ist. 

Femer betrifft die Erfindung einen Liganden, der das erfindungsgemaSe Polypeptid 
spezifiscli bindet, wobei der Ligand Icein Substrat des Polypeptids, kein Cofaktor 
davon und kein davon umgesetztes Produkt ist. 

^^FDer Begriff „spezifiscli bindet" bedeutet erfindungsgemaS, dass der Ligand niclit oder 
im wesentliciien niclit mit anderen Polypeptiden, aucli soiclien mit alinliclier 
PrimSrsequenz oder alinliclier dreidimensionaler Stmktur kreuzreagiert. 
Kreuzreaktivitat kann mit im Stand der Technik bekannten Verfahren ennittelt werden 
(vgl. Harlow und Lane ..Antibodies, A Laboratory Manual", CSH Press, Cold Spring 
Harbor, 1988). Hierzu konnen beispielsweise kompetitive Assays. z.B. 
turbidimetrische Tests eingesetzt werden, in denen der Ligand zusammen mit 
markiertem erfindungsgemSRen Polypeptid und einem damit kompetitierenden 
Polypeptid inkubiert wird, wobei letzteres in unterschiedlichen Konzentrationen 
eingesetzt werden kann. 

^l^ln einer bevorzugten Ausfahrungsfomn ist der erfindungsgemaBe Ligand ein 
Antikfirper oder ein Fragment oder Derivat davon, ein Aptamer, oder eine 
niedermoiekulare Substanz. 

Antikorperfragmente umfassen Fv-, Fab- und F(ab') 2 -Fragmente. Zu den Derivaten 
gehoren scFvs (Harlow und Lane, loc. cit). AntikSrper konnen polyklonalen oder 
monoklonaien Ursprungs sein. 

In einer besonders bevorzugten Ausfiihrungsform des erfindungsgemSBen 
Rezeptors ist dieser ein monoklonaler Aritikdrper. 
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„Nledermolekulare Substanzen" sind erfindungsgemaB natQrIich vorkommende oder 
RQnstlich hergestellte MolekQIe mit einem molekularen Gewicht von etwa 250 bis 
1000 Da, vorzugswelse 300 bis 750 Da, besonders bevorzugt 400 bis 600 Da, oder 
aus Naturstoffen stammende modifizierte MolekQIe mit diesem Molekulargewicht. 

Die beanspruchte Erfindung umfasst weiterliin einen Primer mit einer der in Tabelle 1 
dargestellten Sequenz. 

DarQber hinaus betrifft die Erfindung ein Primerpaar mit in Tabelle 1 dargestellten 
Sequenzen, wobei der erste Primer des Primerpaares als Vorwarts-Primer und der 
zweite Primer des Primerpaares als RQckwarts-Primer zur Amplifizierung einer DNA- 

• Sequenz dient. 
Der erfindungsgemSBe Primer (im Zusammensplel mit einem geeigneten weiteren 
Primer, yorzugsweise einem weiteren in Tabelle 1 aufgefQhrten weiteren Primer) und 
das erfindungsgemaBe Primerpaar kSnnen zur Amplifizierung der 
erfindungsgemSBen Sequenzen eingesetzt werden, vorzugswelse durch PGR oder 
LCR. Die Primer bzw. Primerpaare wurden aus einer VielzainI potentiell mSgliclier 
Primer unter groBem Aufwand ausgesucht. Sie eriauben neben der Amplifikation der 
erfindungsgemaUen Nukleinsauresequenzen auch die Amplifikation von Sequenzen, 
die Enzyme aus dem Stand der Technik kodieren und sind damit vielseitig 
einsetzbar. 

• Ein anderer Gegenstand der Erfindung ist eIn Kit enthaltend 
(a) das erfindungsgemSBe Polypeptid; 

(b) das erfindungsgemSBe NukleinsauremolekQI; 

(c) den erfindungsgemaBen Vektor; 

(d) den erfindungsgemaBen Wirt; 

(e) den erfindungsgemaBen LIganden; 

(f) das erfindungsgemaBe Reaktionssytem; 

(g) mindestens einen erfindungsgemaBen Primer; und/oder 

(h) mindestens ein erfindungsgemaSes Primerpaar. 



Die Komponenten des erfindungsgemaBen Kits konnen einzein oder z.T. zusammen 
in geeigneten GefaBen verpackt werden. Die Komponenten konnen im 
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erfindungsgemSBen Kit beispielsweise in gefriergetroclcneter Form vorliegen oder 
2.B. in L6sung, wobei geeignete LSsungsmittei insbesondere wassrige Losungsmittel 
wie gepufferte Losungen, z.B. piiospliatgepufferte Losungen eiiisciniieBen. 
Die erfindungsgemalien Kits I<c6nnen vielseitig eingesetzt werden. Beispielsweise 
konnen sie zur Identifikation weiterer Alkoholdehydrogenasen oder diese 
kodierender Nukleinsauren dienen, wobei vorzugsweise die erfindungsgemaSen 
Primer eingesetzt werden. In anderen AusfUlirungsformen konnen die 
erfindungsgemSBen Kits zur industriellen Herstellung des erfindungsgemaBen 
Enzyms oder der durcii das Enzym umgesetzten Produkte eingesetzt werden. In 
diesen AusfQhrungsformen wQrde bevorzugt der erfindungsgemaBe Wirt oder das 
erfindungsgemSBe Reaktlonssystem zum Einsatz kommen. 




. Die Figuren zeigen: 

Fig. 1: Stand der Technik via Racematspaltung: mindestens 4-4 Schritte 

Fig. 2: Obersicht des Clusters 2 (=Primergruppe 2), basierend auf 33 Sequenzen 

Fig. 3: PCR-Typisiemng mit Primergruppe 2 unter Venwendung verschiedener Pools 

Die Beispiele eridutern die Erfindung. 

Beispiel 1 : Clusterung der ADHs und Primerdesign 

• Aus einer umfangreichen proprietSren Stammsammlung wurden Stamme priorisiert, 
welche nach erfolgter Viabilitats- und Reinheltskontrolle in FIQssigkultur angezogen 
wurden. Geemtete Zellpellets dienten als Ausgangsmaterlal fQr das genetische 
Screening. Es wurden Primer fQr das genetische Screening nach 
Alkoholdehydrogenase-Genen konstruiert und anschlieBend auf Basis pr§parierter 
genomischer DNA ausgewahiter mikrobieller Isolate mit Hilfe der PGR ausgetestet. 
Die NAD- oder NADP-abhangigen Alkoholdehydrogenasen werden in langkettige, 
mittellange und kurzkettige ADHs eingeteilt. Da die Sequenzheterogenitat innerhalb 
dieser Gruppen signifikant ist, wurden diese basierend auf Sequenzanalysen in 
Clustern gruppiert. Die langkettigen ADHs wurden in drei, die mittellangen in 4 und 
die kurzkettigen in drei Cluster unterteilt. AnschlieBend wurden jeweils vier 
degenerlerte Primer-Sets pro Cluster konstruiert, welche sich in der Nutzung 
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spezifischer Codons- (Codon-usage) unterscheiden, aber gegen diesselben 
Sequenzmotive der Cluster gerichtet sind. 

Beispiel 2: Genetisches Screening nach langkettigen („long-chain")- 
Alkoholdehydrogenasen 

Die „long"-chain ADHs wurden auf Basis von Sequenzanalysen in drei Cluster 
unterteilt und die Primer unter analoger Vorgeiiensweise l<onstruiert und getestet. 
Allerdings wurden trotz gegenteiliger Erwartungen Iceine PCR-Tags amplifiziert, 
welche dieser Gruppe zugeordnet werden konnten. 

Beispiel 3: Genetisclies Screening nacii mttteliangen („medium-ciiain'')- 

•Aikoiioldehydrogenasen 
Das Design von Primem, welche gegen „medlum" chain-ADHs gerichtet sind, wurde 
wie folgt ausgefQhrt: Basierend auf Sequenzanalysen wurden die „medium" chairi- 
ADHs in vier Cluster unterteilt. Daraufhin erfolgte die Konstruktion von jeweils vier 
degenerierten Primer-Sets, welche sich durch die Auswahl der „Codon-usage" 
unterscheiden. Beispielhaft sei dies anhand der Organismengruppe zur Festlegung 
der Primergruppe 2 in Figur 2 graphisch verdeutlicht. Die Primersets wurden 
ausgewahlt anhand von konservierten Regionen bei 33 unterschiedlichen 
Alkoholdehydrogenase-Sequenzen . 

Diese Primergruppen, z.B. die Primergruppe 2, wurden im Anschluss zur 
Untersuchung diverser „Pools" (mit genomischer DNA aus l\/likroorganismen) 

• eingesetzt. Durch Einsatz dieses Primersets konnten neuartlge „medlum"-chain ADH- 
Teilsequenzen amplifiziert, kloniert und sequenziert werden. Das zugehSrige 
Ergebnis dieser PCR-Typisierung ist Im Folgenden in Figur 3 aufgezeigt Wie unter 
anderem Spur 1, 2 und 10 in Figur 3 dokumentieren, wurden hier Jeweils 
Gensequenzen gefunden, die aufgrund der Qbereinstimmenden Gensequenz mIt 
bekannten Genen von ADH-Enzymen auf eine Alkoholdehydrogenase-Aktlvitat 
hindeuten. Insgesamt wurden weitere Gensequenzen mit potentieller 
Alkoholdehydrogenase-Aktivitat identifiziert. Die Identitat der gefundenen Sequenz- 
Taqs mit bereits bekannten ADHs lag zwischen 51- 99%. 
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Beispiel 4: Genetisches Screening nach speziellen „medium-chain"- 
Alkohoidehydrogenasen, mit Analogie zu Alkoholdehydrogenasen aus 
Rhodococcus-Stammen 

Aufgrund der interessanten Eigenschaften der bekannten, ebenfalls zu den „medium 
chain"-Alkoholdehydrogenasen gehorenden (S)-Alkoholdehydrogenase aus 
Rhodococcus erythropolis (S-Re-ADH; dieses Enzym zeichnet sich durch die 
stereoselektlve Umsetzung eines breiten Spektrums an Ketonen und Ketoestern zu 
den korrespondierenden Hydroxyverbindungen aus) sowie weiterer aus 
Rhodococcus-Stammen gewonnenen Alkoholdehydrogenasen wurde der Frage 
nachgegangen, ob es moglich ist, mit Hilfe; eines genetischen Screenings neiiartige 

•ADH-Sequenzen zu identifizieren, welche eine relativ hohe Ahnlichkeit zu dieser 
Sequenz zeigen. Die Antriebskraft ist dabei die Annahme, dad neuartige ADHs, 
deren Sequenzen eine hohe identitat mit der S-Re-ADH-Sequenz teilen, ebenfalls 
interessante Eigenschaften besitzen konnten. Beispielsweise k6nnten solche 
neuartigen ADHs zum einen die bewahrten Eigenschaften der S-Re-ADH besitzen, 
zum anderen aber beispielsweise uber ein verandertes Substratspektrum bzw. eine 
erhohte Expressionsleistung verfugen. Fur die Beantwortung der obigen Frage 
wurden zunachst vergleichende Sequenzanalysen mit der Aminosauresequenz 
dieser S-Re-ADH durchgefuhrt. Diese Analysen ergaben, daS es sich im Fall der S- 
Re-ADH um einen Vertreter des Clusters 1 der mittellangen ADHs handelt. Des 
Welteren konnte innerhalb dieses Clusters eine Gruppe bestehend aus 5 

•Proteinsequenzen ausgemacht werden, welche die S-Re-ADH einschliefit 
Ausgehend von diesen 5 Sequenzen wurden degenerierte Primer unter 
BerUcksichtigung der „codon-usage", entsprechend dem obig beschriebenen 
Vorgehen, konstruiert und ausgetestet 

Um die Anzahl der durchzufdhrenden PCRs zu reduzieren, wurden Pools bestehend 
aus 24 bakteriellen Isolaten angelegt und DNA isoliert, Diese DNA wurde als 
Template eingesetzt. Es wurden zahlreiche Sequenz-Tags ampliflziert und 
sequenziert. Die Analyse der in Aminosauresequenzen ubersetzten Sequenz-Tags 
ergab Obereinstimmungen zur S-Re-ADH-Sequenz von etwa 84% bis 99%, Es 
wurden zwei Volllangengene isoliert, welche durch ein Sequenz-Tag reprasentiert 
werden und auf Aminosauresequenz-Ebene eine Identitat von 98% zur S-Re-ADH 
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zeigen. Die neuen ADHs stammen aus dem Organlsmus Arthrobacter paraWneus 
ATCC21317. Auf DNA-Ebene llegt die Ahnllchkeit bei 94%. Die Isolierung dieser 
VolllSngengene wurde mit Hilfe eines sequenzhomologen Ansatzes durchgefQhrt. 

Beispiel 5: Genetisches Screening nach Icurzkettigen („short-cliain")- 
Allcohoidehydrogenasen 

Aufterdem wurden 12 Primer-Sets fur die l<urzl<ettigen ADHs, welclie gegen die drei 
Cluster dieser Gruppe gerlchtet sind, abschlleSend ausgetestet. Als Template wurde 
DNA eingesetzt, welche aus 5 Isolaten Isoliert worden war, die Im Aktivitats- 
Screening dank Ihrer ADH-Aktivltat entweder 4-Chloracetophenon oder 2-Heptanon 
reduzlert hatten. Die Identltet der AminosMure-Sequenz-Tags zu bekannten 




kurzkettigen ADH-Sequenzen llegt zwischen 47-84%, wobel der Qberwiegende Teil 
dieser Sequenzen eine Identltat von weniger als 67% zu verdfFentllchiten Sequenzen 



zeigt. 

Tabellel: Primersequenzen, die fUr das Screening der die erfindungsgemaBen 
Alkoholdehydrogenasen kodlerenden DNA-Sequenzen eingestzt wurden 



Name Sequenz 5' ■» 3' Direction Blodc 



ADHM1 




AAAGCATGCGGCGTTTGYCAYACNGA 


Forward 


A 


ADHM2 




CCAATGTTTCATCGCTTGATATGBNGTRATNCC 


Reverse 


C 


ADHM3 




TGCGGCGTCTGCCAYACBGA 


Forward 


A 


ADHM4 




GCTTCAGGGCGTGGTAGGBVGTVAYRCC 


Reverse 


c 


ADHM5 




GCGGCGTCTGCCACWCSGA 


Forward 


A 


ADHM6 




GCTTCAGGGCCTGGTAGGBSGTSAYSCC 


Reverse 


c 


ADHM7 




AGCCTGCGGCGTCTGYCAYWCBGA 


Forward 


A 


ADHM8 




GCTTCAGCGCCTGGTAGGBSGTSAYNCC 


Reverse 


c 


ADHM9 




GCAGCTTGCGGCATGTGYCAYACNGA 


Forward 


A 


ADHM10 


GCCCAAGCCGGTCGTAAYNCCRCANCC 


Reverse 


C 


|. ADHM11 


GGCCTGCGGCATGTGYCAYACBGA 


Forward 


A 


f ADHM12 


CCCAAGCCGGTCGTGAYRMMRCAVCC 


Reverse 


C 


^ ADHM13 


CCGGCATGTGCCACACSGA 


Forward 


A 


ADHM14 


TGGCGGCCAGGCCSAYSSCSCC 


Reverse 


C 


ADHM15 


GGCCTCCGGCATGTGYCAYACSGA 


ForvA^ard 


A 


ADHM16 


TGGCGGCCAGGCCSAYNSCNCC 


Reverse 


C 


ADHM17 


TTAAATGGTGCGGCATTTGYGGNWCNGA 


Forward 


A 


ADHM18 


CAACTTAACAGCCAACATGCCDATNGKNCC 


Reverse 


D 


ADHM19 


CAAGGTCAAGTGGTGCGGBATYTGYGG 


Forward 


A 


. ADHM20 


TGACGGCCAACATGCCRATNGKVCC 


Reverse 


D 


ADHM21 


TGCGGCATCTGCGGSWCSGA 


Forward 


A 


ADHM22 


CGAACTTGACGGCGAAGAKSCCGATSGKSC 


Reverse 


D 


ADHM23 


CAAGGTCAAGTGGTGCGGNATCTGYGG 


Forward 


A 


ADHM24. 


CGGCGAAGATGCCGATSGKNCC 


Reverse 


D 


ADHM25 


GATTGTTAGAGTTACAGCTACAGCTATTTGYGGNW65NGA FonwarH 


A 


ADHM26 


TGAACGGCAAACAGGCCNAYNGGNCC 


Reverse 


D 


ADHM27 


CGCCACCGCCATCTGYGGBWSBGA 


Forward 


A 


ADHM28 


GACGGCGAACAGGCCNAYNGGVCC 


Reverse 


D 


ADHM29 


CACCGCCATCTGCGGSWSSGA 


Forward 


A 


ADHM30 


GGAGTGGACGGCGAACAKSCCSAYSGGSC 


Reverse 


D 


ADHM31 


CGCCACCGCCATCTGYGGNWSBGA 


Forward 


A 


ADHM32- 


GACGGCGAACAGGCCSAYSGGNCC 


Reverse 


D 


ADHM39 


AGAAGAACTGGGCATTATGCCNCCNGGNYT 


Forward 


A 


ADHM40 


TGTATCAATTGTCGGTTGATAGCCNACRAARTCNA 


Reverse 


D 
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ADHm41 


ACAACGTGGTCGTGTACGCaNOCN 1 GCjGCd 


porwara 






ADHM42 


GATGGTGGGCTGGTAGCCNACKAAK I UNA 


C3 ^\ ic^ i*c» ^ 

r\ever se 


— — 




ADHM43 


GACAACGTCGTCGTCTAGGGNOUN I 


rtji wdi u 






ADHM44 


AGCGCTTGATGGCGTGR I ANoGNo I 








A r^l t KM A IT 

ADHIvl45 


GACAAOG 1 OG 1 OG 1 U 1 ALrGCaiNJOUN 1 IsLaoo 


i (Jl Wal U 






A r*\i Ik ii 

ADHM46 


GATGGTCGGCTGGTAGCCNACKAAK 1 UNA 


ptever se 






ADHS1 : 


1 1 1 GGCAGAGTTGATG i 1 G 1 1 G 1 YAAYAAYoOIMo 


porwaru 




B 


ADHS2: 


CCATTCACCGCAGA MM GWYGURGMA I A 


D A% rare A 




c 


ADHS3: 


CGTGTCGACGTCGTGGTBVAYAAYGOBG 


poiwara 




B 


ADHS4: 


CACGGCGGGC I I GGWBGCGCMRTA 


rxeverse 






ADHSoa 


CACCGGCGCCACCNSSGGYA 1 oG 


porwara 




A 


ADHSob 


CGTCGACGTCGTUG i UVAUAAOGOoo 


rorwara 




B 


ADHS6 


GACGGCGGGC 1 1 GGWoGUGOMo 1 A 


r\everse 




c 


A r> 1. -1 C>~7^ 

ADHS7a 


CGTCACCGGCGOUUUoNobGLj 


porwara 




A 


ADHS7b 


GCGTCGACGTOG 1 UG I UVALrAAUtaOULa 


porwaru 




B 


A r~M_l oo 

ADHS8 


GACGGCGGGCT T GGYVbGUvjaUlVlva 1 A 


[?a%f Area 




c 


ADHS9 


AAAATTGTTATTGTTACAGGAGGATGOMRNGGNA 1 YvjVj 


porwara 




A 


ADHS10 


AAGCGCACA TTAGCCTGCRl 1 R M NAYiMA 


P A\f A|>oA 




B 


ADHS1 1 


CACCGGCGGCTGCMRNGGYATYGG 


porwara 




A 


ADHS12 


GCTGGACGTGATGTTGAYRATRdKKUU 


O A%/ArOA 

r\e verse 






ADHS13 


TCACCGGCGGCTCCMRSGGNA 1 LrG 


porwara 




A 


ADHS14a 


CCACTAGCCCGCGTTGTTSAYSA 


^!^% 






LADHS14b 


GCTGCTAGGAGGTGATGTTGAYGA 1 ODlxULr 


O Oil re a 




c 


IADHS16 


GTCATCGTCAGCGGCGSSWSCIvlRoGG 


porwara 




A 


'ADHS16 


CTAGCCGGCGTTGTTGAYSA 


r\everse 




B 






Forward 




A 


ADHS18 


AATGCTTGTGTCATCATTTCCAYNSCNCCTTT 


Reverse 




c 


ADHS19 


GACCGGCGCCGGYCGYGGYATYG 


Forward 




A 


ADHS20 


AGGCCTGGGTCATCATCTCSAYRSCVCCYT 


Reverse 




c 


ADHS21 


CCGGCGCCTCGCSRVSGAVGG 


Forward 




A 


ADHS22 


CGATGGAGCCCGGGSMSACGSMGTT 


Reverse 




C 


ADHS23 


CGGCGCCTCGCCRVSGASGG 


Forward 




A 


ADHS24 


GCCCGCGAGCTAGCCSGCGTTGTTGA 


Reverse 




B 
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SEQUENCE LISTING 

<110> Degussa AG 

<120> Neue Alkoholdehydrogenasen 

<130> S-MS-IPM-PAT/Dr. Re-ko - K1419 EP 

<160> 68 

<170> Patent In version 3.1 

<210> 1 

<211> 162 

<212> PRT 

<213> unknown 




<221> source 

<223> ZF0002326= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0050197= Pseudomonas oleovorans; ZF0050294= Rhodococcus; 
ZF0050330« Bacillus; ZF0051303= Bakterium; 2F0051337= Methylomonas ; 
ZF0051321= Bakterium; ZF0050782== Lactobacillus bulgaricus; 
ZF0050544^ Phyllobacterium rubiaceariam; ZF0002852= Rhodococcus; 
Z'F0050310= Arthrobacter paraffineus; ZF0002862= Streptomyces 
clavuligerus; ZF0050292= Bakterium; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434== Streptomyces; 
ZF0002437- Streptomyces; ZF0003712= Micromonospora; ZF0003765= 
Streptomyces; ZF0051305= Bakterium; ZF0003513= Actinomyces; 
ZF0050993= Kocuria; ZF0002018== Streptomyces; ZF0003767= Actinomyces 
ZF0002332= Streptomyces diastatochromogenes; ZF00037 68= Actinomyces 
ZF0002379= Streptomyces coelescens; ZF0002351- Nonomuraea 
roseoviolacea; ZF00037 69- Actinomyces; 

<400> 1 

Gly Pro Trp Gly Cys Gly Asn Cys Trp His Cys Ser Gin Gly Leu Glu 
15 10 15 

Asn Tyr Cys Ser Arg Ala Gin Glu Leu Gly lie Asn Pro Pro Gly Leu 
20 25 30 

• Gly Ala Pro Gly Ala Leu Ala Glu Phe Met He Val Asp Ser Pro Arg 
35 40 45 

His Leu Val Pro He Gly Asp Leu Asp Pro Val Lys Thr Val Pro Leu 
50 55 . 60 

Thr Asp Ala Gly Leu Thr Pro Tyr His Ala He Lys Arg Ser Leu Pro 
65 70 75 80 

Lys Leu Arg Gly Gly Ser Tyr Ala Val Val He Gly Thr Gly Gly Leu 
85 ■ 90 95 
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Gly His Val Ala lie Gin Leu Leu Arg His Leu Ser Ala Ser Thr Val 
100 105 110 



lie Ala Leu Asp Val Ser Ala Asp Lys Leu Glu Leu Ala Thr Lys Val 
115 120 125 



Gly Ala His Glu Val Val Leu Ser Asp Lys Asp Ala Ala Glu Asn Val 
130 135 140 



Arg Lys He Thr Gly Ser Gin Gly Ala Ala Leu Val Leu Asp Phe Val 
145 150 155 160 





Gly Tyr 



<210> 2 
<211> 128 
<212> PRT 
<213> unknown 
<220> 

<221>. source 

<223> ZF000232 6= Actinoplanes itiissouriensis ; ZF0003505= Streptomyces; 
2;F0050197= Pseudomonas oleovorans; ZF0050294= Rhodococcus; 
ZF0050330== Bacillus; ZF0051303= Bakterium; ZF0051337= Methyl omona s ; 
ZF0051321- Bakterixjm; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544= Phyllobacteriiom rubiacearum; ZF0002852= Rhodococcus; 
ZF0050310= Arthrobacter paraffineus; ZF0002862= Streptomyces 
clavuligerus; ZF0050292= Bakterium; ,ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0002437= Streptomyces; ZF0003712= Micromonospora; ZF0003765= 
Streptomyces; ZF0051305= Bakterium; ZF0003513=' Actinomyces; 
ZF0050993== Kocuria; ZF0002018= Streptomyces; ZF0003767= Actinomyces 
ZF0002332= Streptomyces diastatochromogenes ; ZF0003768= Actinomyces 
ZF000237 9= Streptomyces coelescens; ZF0002351= Nonomuraea 
roseoviolacea; ZF00037 69- Actinomyces; 

<400> 2 

Gly Pro Trp Gly Cys Gly Asn Cys Trp His Cys Ser Gin Gly Leu Glu 
1.5 10 15 



Asn Tyr Cys Ser Arg Ala Gin Glu Leu Gly He Asn Pro Pro Gly Leu 
- 20 25 30 



Gly Ala Pro Gly Ala Leu Ala Glu Phe Met He Val Asp Ser Pro Arg 
35 40 45 
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His Leu Val Pro He Gly Asp Leu Asp Pro Val Lys Thr Val Pro Leu 
50 55 60 



Thr Asp Ala Gly Leu Thr Pro Tyr His Ala lie Lys Arg Ser Leu Pro 
65 70 75 80 



Lys Leu Arg Gly Gly Ser Tyr Ala Val Val He Gly Thr Gly Gly Leu 
85 90 95 



Gly His Val Thr He Gin Leu Leu Arg His Leu Ser Ala Ala Thr Val 
100 105 110 



He Ala Leu Asp Val Ser Ala Asp Lys Leu Glu Leu Ala Thr Lys Val 
115 120 125 




<220> . . 

<221> source 

<223> ZF005028 6= Corynebacterium hoagii 
<400> 3 

Gly Pro Trp Gly Cys Gly Arg Cys Trp His Cys Ala Gin Gly Leu Glu 
15 10 15 



Asn Tyr Cys Ser Arg Ala Arg Glu Leu Gly He. Ala Pro Pro Gly Leu 
20 25 * 30 • ■ • 



Gly Ala Pro Gly Ala He Ala Glu Tyr Met He Val Asp Ser Pro Arg 
35 40 45 



His Leu Val Pro He Gly Asp Leu Asp Pro Val Thr Thr Val Pro Leu 
50 55 60 



Thr Asp Ala Gly Leu Thr Pro Tyr His Ala He Lys Arg Ser Leu Gly 
65 70 75 80 



Lys Leu Arg Ala Gly Ser Tyr Ala Val Val He Gly Thr Gly Gly Leu 
85 90 95 



Gly His Val Gly He Gin Leu Leu Arg His Leu Ser Pro Ala Arg He 
100 105 110 
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lie Ala Leu Asp Val Asn Asp Glu Lys Leu Ala Phe Ala Arg Glu Val 
115 120 125 



Gly Ala His Glu Thr Val Leu Ser Asn Ala Asp Ala Ala Ala Asn Val 
130 135 140 



Arg Lys lie Thr Gly Ser Ala Gly Ala Ala Leu Val Leu Asp Phe Val 
145 150 155 160 



Gly Tyr 



<210> 4 

<211> 161 

212> PRT 

<213> unknown 



<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 
<400> 4 

Gly Pro Trp Gly Cys Gly Ser Cys Trp His Cys Ser Gin Gly Leu Glu 
15 10 15 



Asn Tyr Cys Ser Arg Ala Lys Glu Leu Gly lie Asn Pro Pro Gly Leu 
20 25 30 



• 



jGly Ala Pro Gly Ala Leu Ala Glu Phe Met lie Val Asp Ser Pro Arg 
35 40 45 



His Leu Val Pro lie Gly Asp Leu Asp Pro Val Lys Thr Val Pro Leu 
50 55 60 



Thr Asp Ala Gly Leu Thr Pro Tyr His Ala lie Lys Arg Ser Leu Pro 
65 70 75 80 



Lys Leu Arg Gly Gly Ala Tyr Ala Val Val lie Gly Thr Gly Gly Leu 
85 90 95 



Gly His Val Ala lie Gin Leu Leu Arg His Leu Ser Ala Ala Thr Val 
100 105 110 



lie Ala Leu Asp Val Ser Ala Asp Lys. Leu Val Leu Ala Thr Lys Val 
115 120 125 
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Gly Ala His Glu Val Val Leu Ser Asp Lys Asp Ala Ala Glu Asn Val 
130 135 140 



Arg Arg lie Thr Gly Ser Gin Gly Ala Ala Leu Val Leu Asp Phe Val 
145 150 155 160 



Gly 



<210> 



<211> 70 



• 



<212> PRT 
<213> Tinknown 
<220> 
<221> source 

<223> ZF0004210= Actinomyces; 

Actinomyces; ZF00038 60= 
ZF00038 68= Actinomadura; 
Act inomy ces ; Z FO 0 0 3 8 6 6= 
ZF0003862= Actinomadura; 
Actinomadura; Zf60O4216= 
ZF0004209= Actinomadura; 
Act inomy ce s ; ZF0004063= 
. ZF0006405= Streptomyces; 
Act inomadur a; ZF0004070= 
ZF0004217= Actinomyces; 
Actinomadura; ZF0006138~ 
ZF0051203= Bakterium; 



ZF0004212« Actinomyces; ZF0004211== 
Actinomyces; ZF0004218= Actinomyces; 

ZF0004213= Actinomyces; ZF0003876= 
Actinomyces; ZF00038 64= Actinomyces; 

ZF0003869= Actinomyces; ZF0003867= 
= Actinomyces; ZF0004235= Actinomyces; 

ZF0004214= Actinomyces; ZF0003871=^ 
Actinomadura; ZF0004052= Actinomadura; 

ZF0003865= Actinomadura; ZF0004047= 
= Actinomyces; ZF0004085= Actinomyces; 
ZF0004089=^ Actinomadura; ZFOp04090= 
Streptomyces; ZF0004236« Actinomadura; 




<400> 5 

Gly Pro Trp Gly Cys Gly Thr Cys Val Lys Cys Ala Glu Gly Lys • Glu 
1 5 . 10 15 



Asn Tyr Cys Leu Arg Ala Lys Glu Leu Gly lie Ala Pro Pro Gly Leu 

20 • .25 30 



Gly Ser Pro Gly Ala Met Ala Glu Tyr Met lie Val Asp Asp Pro Arg 
35 • 40 45 



His Leu Val Pro Leu Gly Gly Leu Asp Pro Val Gin Ala Val Pro Leu 
50 55 60 



Thr Asp Ala Gly Leu Thr 
65 70 



<210> 6 



<211> 94 
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<212> PRT 



<213> unknown 



<220> 
<221> 
<223> 



source 

ZF0002326= Actinoplanes missouriensis ; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544= Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993= Kocuria; ZF0002018== Streptomyces; ZF0003767= Actinomyces; 
ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis ; 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakteriiom; 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces; ZF0004821- 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes ; ZF0002396= 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512- Actinomyces; 
ZF0006093- Streptomyces; ZF0006103= Streptomyces; ZF0006087- 
Streptomyces; ZF005044 6= Bakteritim; ZF0050445= Bakterium; ZF000608 6= 
Streptomyces; ZF0002322= Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 



<400> 



Cys . His Thr Asp His His lie Val Thr Gly Ala Thr Pro Met Pro Ser 
15 10 15 



Phe Pro Val Met Gly Gly His Glu Gly Ser Gly Val lie Thr Lys Leu 
20 25 30 



Gly Pro Glu Val Lys Gly Leu Glu Val Gly Asp His Val Val Leu Ser 
35 .40 45 



Phe lie Pro Ala Cys Gly Thr Cys Pro Ala Cys Ser Ala Gly His Gin 
50 55 60 



sn Leu Cys Asp Leu Gly Met Gly Leu Leu Ser Gly Gin Ala lie Ser 
5 70 75 80 



Asp Gly Thr Tyr Arg lie Gin Ala Arg Gly Glu Asn Val lie 
85 90 



<210> 7 

<2il> 92 

<212> PRT 

<213> unknown 
<220> 



<221> source 

<223> ZF000232 6= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544=^ Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
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2F0002349= Streptomyces spectabilis; ZF0002434= Streptomyces ; 
ZF0050993= Kocuria; ZF0002018= Streptomyces; ZF0003767= Actinomyces; 
ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis; 
ZF000244i= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakterium; 
ZF0051240= Bakterium; ZF0002333- Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces; ZF0004821= 
Actinomyces; ZF0002359— Actinoplanes ianthinogenes; ZF0002396= 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512~ Actinomyces; 
ZF0006093= Streptomyces; ZF0006103« Streptomyces; ZF0006087=' 
Streptomyces; ZF0050446= Bakterium; ZF0050445« Bakteriiim; ZF0006086= 
Streptomyces; ZF0002322« Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 

<400> 7 

Cys His Thr Asp Asp His Ala Val Thr Gly Asp Leu Ala Val Pro Leu 

1 5 10 15 . 



•Pro Val lie Gly Gly His Glu Gly Ala Gly lie Val Glu Lys Val Gly 
20 25 30 

Pro Gly Val Arg Asp Val Glu Val Gly Asp His Val Val Leu Ser Phe 
35 40 45 



lie Pro Ser Cys Gly Arg Cys Arg Trp Cys Ala Val Gly Gin Ser Asn 

50 . 55, 60 



Leu Cys Asp Leu Gly Ala lie Leu Met Ala Gly Ala Gin Val Asp Gly 
65 70 75 80 



Thr Tyr Arg Ala Thr Ala Afg Gly His Asp Val Gly 
85 90 



8 

92 

PRT 

unknown 



source 

ZF0002326= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544= Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993= Kocuria; ZF0002018= Streptomyces; ZF0003767- Actinomyces; 
ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis; 
ZF0002441= Streptomyces; ZF0051307= Bakteriiom; ZF0051301= Bakterium;'. 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980== Streptomyces; ZF0004821= 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes; ZF0002396= 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103- Streptomyces; ZF0006087= 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086= 



# 



<210> 

<211> 

<212> 

<213> 

<220> 

<221> 
<223> 
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Streptomyces; 2F0002322= Rhodococcus ; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 

<400> 8 

Cys His Thr Asp Asp His Ala Val Thr Gly Asp Leu Ala Val Pro Leu 
1 5 10 15 



Pro Val lie Gly Gly His Glu Gly Ala Gly He Val Glu Lys Val Gly 
20 25 30 



Pro Gly Val Arg Asp Val Glu Val Gly Asp His Val Val Leu Ser Phe 
35 40 45 



He Pro Ser Cys Gly Arg Cys Arg Trp Cys Ala Val Gly Gin Ser Asn 
. 50 55 60 



eu Cys Asp Leu Gly Ala He Leu Met Ala Gly Ala Gin Val Asp Gly 
5 70 75 80 



Thr. Tyr Arg Ala Thr Ala Arg Gly His Asp Val Gly 
85 90 



<210> 9 



<211> 92 

<212> PRT 

<213> unknown 
<220> 




<221> 
<223> 



source 

ZF0002326= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544== Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF0002349== Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993= Kocuria; ZF0002018= Streptomyces; ZF00037 67= Actinomyces; 
ZF0003764= Streptomyces; ZFO 002 3 31= Actinoplanes philippinensis; 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakteriiom; 
ZF0051240= Bakterium; ZF0D02333= Rhodococcus erythropolis; 
ZF0003713== Micromonospora; ZF0004980= Streptomyces; ZF0004821= 
Actinomyces; ZFQ0G2359= Actinoplanes ianthinogenes; ZF0G02396= 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; 'ZF0006087- 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086= 
Streptomyces; ZF0002322= Rhodococcus; ZF0003538- Actinomyces; 
ZF0003535= Actinomyces; 



<400> 9 



Cys His Thr Asp Asp His Ala Val Thr Gly Asp Leu Ala Val Pro Leu 
1 5 10 15 . 



Pro Val He Gly Gly His Glu Gly Ala Gly He Val Glu Lys Val Gly 
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20 25 30 



Pro Gly Val Arg Asp Val Glu Val Gly Asp His Val Val ' Leu Ser Phe 
35 40 4'5 



lie Pro Ser Cys Gly Arg Cys Arg Trp Cys Ala Val Gly Gin Ser Asn 
50 55 60 



Leu Cys Asp Leu Gly Ala lie Leu Met Ala Gly Ala Gin Val Asp Gly 
65 70 75 80 



Thr Tyr Arg Ala Thr Ala Arg Gly His Asp Val Gly 
85 90 



< 

• 



<210> 10 
211> 92 
<212> PRT 




<213> unknown 
<220> 

<221> source 

<223> ZF0002326= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF005054 4= Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF000234 9= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF005Q993= Kocuria; ZF0002018= Streptomyces; ZF00037 67= Actinomyces 
' ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis; 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakterium 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis ; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces; ZF0004821= 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes; ZF0002396= 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; ZF0006087== 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086 
Streptomyces; ZF0002322= Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 

<400> 10 

Cys His Thr Asp Asp His Ala Val Thr Gly Asp Leu Ala Val Pro Leu 
1 5 10 ■ . 15 



Pro Val lie Gly Gly His Glu Gly Ala Gly lie Val Glu Lys Val Gly 
20 25 30 



Pro Gly Val Arg Asp Val Glu Val Gly Asp His Val Val Leu Ser Phe 
35 40 45 



lie Pro Ser Cys Gly Arg Cys Arg Trp .Cys Ala Val Gly Gin Ser Asn 
50 55 60 
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Leu Cys Asp Leu Gly Ala He Leu Met Ala Gly Ala Arg Val Asp Gly 
65 70 75 80 



Thr Tyr Arg Ala Thr Ala Arg Gly His Asp Val Gly 
85 90 



<210> 11 



<211> 92 



<212> PRT 



<213> unknown 



<220> 




<221>- 
<223> 



source 

ZF0002326= Actinoplanes missouriensis ; ZF0003505= Streptomyces ; 
ZF0G51321== Bakterium; ZF005Q782= Lactobacillus bulgaricus; 
ZF0050544= Phyllobacterium rubi ace arum; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993« Kocuria; ZF0002018= Streptomyces; ZF0003767= Actinomyces; 
ZF00Q3764= Streptomyces; ZF0002331= Actinoplanes philippinensis; 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakterium; 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980== Streptomyces; ZF0004821= 
Actinomyces; ZF0602359« Actinoplanes ianthinogenes; ZF0002396== 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF000 6093- Streptomyces; ZF0006103= Streptomyces; ZF0006087= 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086= 
Streptomyces; ZF0002322- Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 



<400> 11 



Cys His Thr Asp Asp His Ala Val Thr Gly Asp Leu Ala Val Pro Leu 



10 



15 



ro Val He Gly Gly His Glu Gly Ala Gly He Val Glu Lys Val Gly 
20 25 30 



Pro' Gly Val Arg Asp Val Glu Val Gly Asp His Val Val Leu Ser Phe 
35 40 45 



He Pro Ser Cys Gly Arg Cys Arg Trp Cys Ala Val Gly Gin Ser Asn 
50 55 60 



Leu Cys Asp Leu Gly Ala He Leu Met Ala Gly Ala Gin Val Asp Gly 
65 . 70 75 80 



Thr Tyr Arg Ala Thr Ala Arg Gly His Asp Val Gly 
85 • 90 



<210> 12 



40 




<211> 93 

<212> PRT 

<213> unknown 

<220> 

<221> source 

<223> ZF0050310« Arthrobacter paraffineus 

<400> 12 ■ ■ 

Cys His Thr Asp Leu Phe Thr Lys Ser Val Leu Pro Glu Arg Leu Gly 
1 5 10 15 • 



Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Glu Ala Val Gly 
20 25 ' 30 



er Ser He Asp Ser He Ala Pro Gly Asp His Val Leu Leu Ser Tyr 
• 35 40 45 



Arg. Ser Cys Gly Val Cys Arg Gin Cys Leu Ser Gly His Arg Ala Tyr 
50 .55 60 



Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr Asp Gly 
65 70 75 80 



Ser Thr Pro Val Arg Arg Ser Gly Thr Pro He Arg Ser 
85 90 



<210> 


13 


<211> 


93 


bj:212> 


PRT 


<213> 


unknown • 


<220> 




<221> 


source 


<223> 


ZF0002333 


<400> 


13 



Cys His Thr Asp Leu Phe Thr Lys Thr Val Leu Pro Glu Lys Leu Gly 
15 10 15 



Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Gin Ala Val Gly 
20 25 30 



Ser Ser He Asp Asn He Ala Ala Gly Asp His Val Leu Leu Ser Tyr 
35 40 45 
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Arg Ser Cys Gly Val Cys Arg Gin Cys Leu Ser Asp His Arg Ala Tyr 
50 55 60 

Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr Asp Gly 
65 70 75 80 



Ser Thr Pro Val Arg Arg Asn Gly Thr Pro lie Arg Ser 
85 90 



<210> 14 

<211> 120 

<212> PRT 

<213> unknown 



•k:220> 



<221> source 

<223> ZF0051303= Bakterium; ZF0051337- Methylomonas ; ZF00028 62= 

Streptomyces clavuligerus; ZF0050292= Bakteri\am; ZF0051305= 
Bakterium; ZF0003513= Actinomyces; ZF0002351= Nonomuraea 
roseoviolacea; ZF0003769= Actinomyces; ZF0002017= Streptomyces; 
ZF0051306= Bakterium; ZF0002016= Streptomyces; ZF0003504= 
Actinomyces; ZF0b06073= Streptomyces; ZF0003770= Actinomyces; 
ZF0002352= Actinoplanes italicus; ZF0002378= Streptomyces 
aureomonopodiales; ZF0006089= Streptomyces; ZF0006106* Streptomyces 
ZF0051325= Bakterium; ZF0006108= Streptomyces;. ZF0002440= 
Streptomyces; ZF0051302== Bakterium; ZF0003532= Actinomyces; 
ZF0003548= Nocardiaf orm;- 

'<400> 14 

Cys Gly Thr Asp Arg Glu lie Ala Ser Gly lie Tyr Gly Trp Ala Pro 
1 5 . 10 ■ . 15 



ro Gly Arg Glu His Leu Val Leu Gly His Glu Ser Leu Gly Arg Val 

20 25 . 30 

Arg Thr Ala Pro Asp Gly Ser Gly Phe Ala Ala Gly Asp Leu Val Val 
35 40 45 

Gly lie Val Arg Arg Pro Asp Pro Val Pro Cys Gly Ala Cys Ala His 
50 55 60 

Gly Glu Phe Asp Met Cys Arg Asn Gly Glu Tyr Val Glu Arg Gly lie' 
65 • 70 75 80 



Lys Gin lie Asp Gly Tyr Gly Ser Thr Ser Trp Val Val Asp Ala Asp 
85 90 95 



42 




Tyr Thr Val Lys Leu Asp Pro Ala Leu Thr Glu Val Gly Val Leu Met 
100 105 110 

Glu Pro Thr Thr Val Leu Gly Gin 
115 120 

<210> 15 
<211> 140 
<212> PRT 
<213> unknown 
<220> 

<221> source 

<223> ZF0051303= Bakterium; ZF0051337= Methyl omona s ; ZF00028 62= 

Streptomyces clavuligerus ; ZF0050292'= Bakterium; ZF0051305== 
Bakterium; ZFOO 03513== Actinomyces; ZF0002351« Nonomuraea 
roseoviolacea; ZF0003769= Actinomyces; ZF0002017= Streptomyces; 
ZF0051306= Bakterium; ZF0002016= Streptomyces; ZF0003504= 
Actinomyces; ZF0006073= Streptomyces; ZF0003770= Actinomyces; 
ZF0002352= Actinoplanes italicus; ZF0002378= Streptomyces 
aureomonopodiales; ZF0006089= Streptomyces; ZF0006106= Streptomyces 
ZF0051325= Bakterium; ZF0006108= Streptomyces; ZF0002440-= 
Streptomyces; ZF0051302= Bakterium; ZF0003532= Actinomyces; 
ZF0003548== Nocardiaf orm; 

<400> 15 

Cys Gly Thr Asp Leu His lie Arg Ser Trp Asp Gly Trp Ala Gin Lys 
1 -5 10 - 15 

Thr lie Ala Thr Pro Leu Thr Leu Gly His Glu Phe Val Gly Glu Val 
20 25 30 



al Glu Thr Gly Arg Asp Val Thr Asp lie Gin Val Gly Asp Leu Val 
35 40 45 



Ser Gly Glu Gly His Leu Val Cys Gly Lys Cys Arg Asn Cys Leu Ala 
50 55 60 



Gly Arg Arg His Leu Cys Arg Ala Thr Val Gly Leu Gly Val Gly Arg 
65 70 75 80 



Asp Gly Ala Phe Ala Glu Tyr Val Val Leu Pro Ala Ser Asn Val Trp 
85 90 95 



Val His Arg Val Pro Val Asp Leu Asp Val Ala Ala He Phe Asp Pro 
100 105 110 



Phe Gly Asn Ala Val His Thr Ala Leu Ser Phe Pro Leu Val Gly Glu 



43 



115 



120 



125 



Asp Val Leu Val Thr Gly Ala Gly Thr He Gly He 
130 135 140 



<210> 

<211> 

<212> 

<213> 

<220> 

<221> 
<223> 




source 

ZF0050197= Pseudomonas oleovorans; ZF0050294= Rhodococcus; 
ZF0050330« BacHlus, ZF0002852= Rhodococcus; ZF0050310= Arthrobacter 
paraffineus; ZF0002437= Streptomyces; ZF0003712= Micromonospora; 
ZF0003765= Streptomyces; ZF0002332= Streptomyces 

diatsatochromogenes; ZF0003768= Actinomyces; ZF0002379= Streptomyces 
coelescens; ZF0002443= Streptomyces; ZF0002442= Streptomyces; 
ZF0002436:= Streptomyces; ZF0050994= Bakterium; ZF0050992- Bakteritam; 
'ZF0050442= Bakterium; ZF0002049= Streptomyces; ZF0006069= 
Streptomyces; ZF0006075'= Streptomyces; ZF0004724= Nocardiaf orm; 
ZF0002392= Actinoplanes nipponensis; ZF0002356= Actinoplanes 
brasiliensis; ZF0003501= Actinomyces; ZF0051322=^ Bakterium; 
ZF0006078= Streptomyces; ZF0006092= Streptomyces; ZF0006090= 
Streptomyces; ZF0006084= Streptomyces; ZF0006068= Streptomyces; 
ZF0050284= Rhodococcus; ZF0050028= Agrobacterium tiamef aciens; 
ZF0003540= Actinomyces; ZF0003528== Actinomyces; ZF0003529= 
Actinomyces; 



<400> 16 



Gly Leu Thr He Gly His Glu Pro Val Gly Val He Glu Lys Leu Gly 
1*5 .10 15 




ler Ala Val Thr Gly Tyr Arg Glu Gly Gin Arg Val He Ala Gly Ala 
20 25 30 



He Cys Pro Asn Phe Asn Ser Tyr Ala Ala Gin Asp Gly Ala Pro Ser 
35 40 45 



Gin Asp Gly Ser Tyr Leu Val Ala Ser Gly Ala Cys Gly Cys His Gly 
50 55 60 



Tyr Arg Ala Thr Ala Gly Trp Arg Phe Gly Asn He He Asp Gly Ala 
65 70 75 80 



Gin Ala Glu Tyr Leu Leu Val Pro Asp Ala Gin Gly Asn Leu Ala Pro 
85 90 95 



Val Pro Asp Asn Leu Ser Asp Glu Gin Val Leu Met Cys Pro Asp He 
100 105 110 



44 



Met Ser Thr Gly Phe Lys Gly Ala Glu Asn Ala His lie Arg lie Gly 
115 120 125 



Asp Thr Val Ala Val Phe Ala Gin Gly Pro 
130 135 



<210> 17 , 
<211> 144 ■ 
<212> PRT- 
<213> unknown 
<220> 

^221> source 

ft223> ZF0050197= Pseudomonas oleovorans; ZF0050294=- Rhodococcus; 

r ZF0050330= Bacillus, ZF0002852= Rhodococcus; ZF0050310= Arthrobacter 

paraffineus; ZF0002437= Streptomyces; ZF0003712= Micromonospora; 

ZF0003765= Streptomyces; ZF0002332= Streptomyces 

diatsatochromogenes; ZF00037 68- Actinomyces; ZFO 00 237 9= Streptomyces 
coelescens; ZF0002443= Streptomyces; ZF0002442= Streptomyces; 
ZF0002436= Streptomyces; ZF0050994- Bakterium; ZF0050992- Bakterium; 
ZF0050442= Bakteriiam; ZF0002049= Streptomyces; ZF0006069= 
Streptomyces; ZF0'006075« Streptomyces; ZF0004724= Nocardiaf orm; 
ZF0002392= Actinoplanes nipponensis; ZF0002356= Actinoplanes 
brasiliensis; ZF0003501= Actinomyces; ZF0051322= Bakterium; 
ZF0006078= Streptomyces; ZF0006092= Streptomyces; ZF0006090== 
Streptomyces; ZF0006084= Streptomyces; ZF0006068= Streptomyces; 
ZF0050284= Rhodococcus; ZF0050028== Agrobacterium t\amef aciens; 
ZF0003540- Actinomyces; ZF0003528=== Actinomyces; ZF0003529= . 
Actinomyces ; 



<400> 



17 




:ys 



Gly Thr Asp Leu His lie Leu Gly Gly Asp Val Pro Glu Val Thr 
5 10 15 



Asp 



Gly Arg lie Leu Gly His Glu Ala Val Gly Thr Val Val Glu Val 
20 25 30 



Gly 



Asp Gly Val Gin Thr Leu Ala Pro Gly Asp Arg Val Leu Val Ser 
35 40 45 



Cys 



Val Thr Ala Cys Gly Thr Cys Arg. Phe Cys Arg Glu Ser Arg Tyr 
50 55 60 



Gly 
65 



Gin Cys Leu Gly Gly Gly Gly Trp lie Leu Gly His Leu lie Asp 
70 75 80 



Gly 



Thr Gin Ala Glu Leu Val Arg Val Pro Tyr Ala Asp Asn Ser Thr 
85 90 95 



45 



His Arg lie Pro Asp Gly Val Ser Asp Glu Gin Met Leu Met Leu Ala 
100 105 110 

Asp lie Leu Pro Thr Ser Tyr Glu Val Gly Val Leu Asn Gly Cys Leu 
115 120 125 

Arg Pro Ala Asp Val Val Val He He Gly Ala Asp Asp Arg Pro Leu 
130 135 140 



<210> 


18 


<211> 


73 


<212> 


PRT 


<213> 


unknown 


|c220> 




<221> 


source 


<223> 


ZF0050310 


<400> 


18 




Val Asp Val Val Val Asp Asn Ala Gly Phe Gly Thr His Gly Ala Phe 
1 5 10 15 

Val Asp Glu Asp His Glu Arg Val Thr Ser Glu He Gin Leu Asn He 
20 25 30 

Ala Thr Leu Val Glu Leu Thr His Thr Phe Pro Pro Asp Leu Leu Thr 
35 40 45 . 

Gly Arg Gly Ala Leu Val Asn He Ala Ser Thr Ala Ser Phe Gin Pro 
50 55 60 



Thr Pro Gly Met Ala Val Tyr Cys Ala 
65 70 



<210> 


19 


<211> 


75 


<212> 


PRT 


<213> 


unknown 


<220> 




<221> 


source 


<223> 


ZF0050310 



<400> 



19 



46 



Val Asp Val Val Val His Asn Ala Gly Phe Gly Thr His Gly Ala Phe 
1 5 10 15 

Val Asp Glu Asp Leu Glu Arg Val Thr Ser Glu He Gin Leu Asn He 
20 25 30 

Ala Thr Leu Val Glu Leu Thr His Thr Phe Leu Pro Asp Leu Leu Thr 
35 40 45 

Gly Arg Gly Ala Leu Val Asn He Ala Ser Thr Ala Ser Phe Gin Pro 
50 55 60 



Thr Pro Gly Met Ala Val Tyr Cys Ala Thr Lys 
65 70 75 




^210> 


20 


"<211> 


79 


<212> 


PRT 


<213> 


unknown 


<220> 




<221> 
<223> 


source 
ZF0003535 


<400> 


20 




Arg Val Asp Val Val Val His Asn Ala Ala He Thr Gin Lys Ala Thr 
15. 10 15 

Phe Arg Asp He Thr Pro Ala Asp Phe Glu Arg He Leu Arg Val Asn 
20 25 30 

Leu Thr Gly Val Phe Asn Leu Ser Gin Ala Val He Pro Leu Met He 
35 . 40 45 

Gin Arg Gly Gly Gly Ser He Val Ser He Ser Ser Leu Ser Ala- Gin 
50 55 60 

Asn Gly Gly Gly He Phe Gly Gly Ala His Tyr Cys Ala Thr Lys 
65 70 75 



<210> 21- 
<211> 76 
<212> PRT 



<213> 



unknown 



47 




<220> 

<221> source 

<223> ZF0003535= Actinomyces 
<400> 21 

Val Asp Val Val Val Asp Asn Ala Gly Leu Ala Leu Gly Thr Ala Pro 
1 .5 10 15 

Ala Pro Gin Val Pro Leu Lys Asp Trp Gin Thr Met Val Asn Thr Asn 
20 25 30 

He Thr Gly Leu Leu Asn He Thr His His Leu Leu Pro Thr Leu He 
35 40 45 

Asp Arg Lys Gly He Val Val Asn Leu Ser Ser Val Ala Ala His Tyr 
50 55 60 



Pro Tyr Thr Gly Gly Asn Val Tyr Cys Ala Ser Lys 
65 70 75 



<210> 22 

<211> 72 

<212> PRT . 

<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 



m 

^^G 



400> 22 



hln Gly He Gly Tyr Ala Thr Ala Lys Arg Leu He Ser Leu Gly Ala 
15 10 15 

Thr Val Ala He Gly Asp He Asp Glu.Ala Thr Leu Ala Arg Ala Ala 
20 25 30 

Lys Asp Leu Gly He Arg Thr Phe Gly Arg Leu Asp Val Thr Asp Pro 
35 40 45 

Ala Ser Phe Phe Asp Phe Leu Asp Thr Val Glu Gly Glu Leu Gly Pro 
50 55 60 



He Asp Val Leu He Asn Asn Ala 
65 70 



<210> 23- 



48 



<211> 75 

<212> PRT 

<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 

<400> 23 

Gin Arg He Gly Leu Glu lie Ala Arg Thr Phe He Lys Glu Gly Ala 
1 5 • 10 15 

Thr Val Val Leu Gly Asp He Asn Glu Thr Val Gly Thr Ala Ala Val 
20 25 30 



• 



a Glu Leu Gly Gly Glu Ser Val Ala Arg Phe Ala Ser Cys Asp Val 
35 40 45 ■ 

Arg Asp Ser Gly Gin Val Glu Ala Met Leu Asp Leu Ala Glu Ser Ala 
50 55 60 



Phe Gly Pro Val' Asp Val Met Met Asn Asn Ala 
65 70 75 



<210> 24 

<211> 72 

<212> PRT 

<213> unknown 
<220> 



<221> source 

<223> ZF0050310- Arthrobacter paraffineus 
<400> 24 

Gin Gly He Gly Tyr Gin Thr Ala Lys Glu Leu He Arg Arg Gly His 
1 5 10 .15 

Arg Val Ala He Gly Asp He Asp Glu Ala Arg Ala Lys Glu Thr Ala 
20 25 30 • 

Ala Glu Leu Gly Val Lys Val Val Thr Arg Leu Asp Val Thr Asp Pro 
35 -40 45 ■ 



Asp Ser Phe Lys Asp Phe Leu Asp Leu Val Glu Gly Asp Leu Gly Pro 
50 55 60 - 



49 



Leu Asp Val Leu He Asn Ash Ala 
65 70 



• 



<210> 


25 


<211> 


74 


<212> 


PRT 


<213> 


unknown 


<220> 




<221> 


source 


<223> 


ZF0050310 


<400> 


25 


bly He Gly Leu 



10 15 



Val. Val Leu Gly Asp He Asn Glu Thr Val Gly Thr Ala Ala Val Ala 
20 . 25 30 



Glu Leu Gly Gly Glu Ser Val Ala Arg Phe Ala Ser Cys Asp Val Arg 
35 40 45 



Asp Ser Gly Gin Val Glu Ala Met Leu Asp Leu Ala Glu Ser Ala Phe 
50 55 . 60 



Gly Pro Val Asp Val He Val Asn Asn Ala 

65 7 0 



pio> 


26 


<211> 


74 


<212> 


PRT 


<213> 


unknown • 


<220> 




<221> 


source 


<223> 


ZF0050310 


<400> 


26 



He Gly Leu Glu He Ala Arg Thr Phe He Lys Glu Gly Ala Thr Val 
15 10 15 



Val Leu Gly Asp He Asn Glu Thr Val .Gly Thr Ala Ala Val Gly Glu 
20 25 30 



50 



Leu Gly Gly Glu Ser Val Ala Arg Phe Ala Ser Cys Asp Val Arg Asp 
35 40 45 

Ser Gly Gin Val Glu Ala Met Leu Asp Leu Ala Glu Ser Ala Phe Gly 
50 55 60 

Pro Val Asp Val Met Val Asn Asn Ala Gly 
65 70 



<210> 


27 


<211> 


62 


<212> 


PRT 


<213> 


unknown 


^220> 




<221> 


source 


<223> 


.ZF0002333 


<400> 


27 


Val Pro Val Ala 




Val Ala Leu He Glu Ser Gin Tyr Gly Thr Pro Ala Leu Ala Leu Glu 
20 25 30 

Ala Asp Val Arg Asp Arg Ala Ala Val Ser Ala Ala Phe Glu Ala Thr 
35 40 45 

Val Ala Glu Trp Gly Arg Phe Asp Tyr Leu Val Asn Ash Ala 
50 .55 .60 



<210> 


28 


<211> 


74 


<212> 


PRT 


<213> 


unknown 


<220> 




<221> 


source 


<223> 


ZF0002333 


<400> 


28 


Leu Gly Arg Glu 



10 15 



51 



Val Val Asn Asp Leu Asp Pro Glu Pro Ala Ala Gin Thr Glu Arg Asp 
20 25 30 

He Lys Ala Thr Gly Gly Gin Ala Val Ser Cys Val Gly Ser Val Ala 
35 40 45 

Glu Asp Gly Phe Ala Glu Arg Phe Val Asn Thr Ala Val Glu Ser Phe 
50 55 60 



Gly Gly Leu Asp Val Met Val Asn Asn Ala 
65 70 



<210> 29 
<211> 76 



•<212> PRT 

<213> unknown 
<220> 

<221> source 

<223> ZF0002333= Rhodococcus erythropolis 

<400> 29 



Ala Gly Leu Gly Val Glu Phe Ala His Arg Phe Ala Ala Arg Gly Ala 
15 10 15 

Asn Leu Val Leu Val Ala Arg Arg Ala Asp Arg Leu Glu Ala Leu Ala 
20 25 30 



Thr Glu Leu Arg Val Ala His .Gly He Thr Val Thr Val Leu Pro Ala 
35 40 45 



Asp Leu Ala Ala Pro Gly Val Gly Ala Thr Leu His Gin Glu Leu Thr 
50 55 60 



Ser Arg Gly He Thr Val Thr Ser Leu He Asn Asn 
65 70 75 



<210> 30 



<211> 72 
<212> PRT 
<213> unknown 



<220> 

<221> source 

<223> ZF0003535= Actinomyces 



52 





<400> 30 

Pro Ala Asp Gly Tyr Gin Thr Ala Lys Glu Leu lie Arg Arg Gly His 
1 5 10 15 

Arg Val Ala He Val Asp He Asp Glu Ala Arg Ala Lys Gly Ala Ala 
20 25 ■ 30 

Ala Glu Leu Gly Val Lys Val Val Thr Arg Leu Asp Val Thr Glu Pro 
35 40 45 

Asp Ser Phe Thr Thr Phe Leu Asp Leu Val Glu Arg Glu Leu Gly Pro 
50 .55 60 



Leu Asp He Leu Val Asn Asn Ala 
65 70 



<210> 31 

<211> 67 

<212> PRT 

<213> unknown 

<220> 

<221> source 

<223> ZF0050310=» Arthrobacter paraf f ineus 

<400> 31 

Ala Thr Asp Gly Ala Arg Val Ala Val Val Asp Leu His He Glu Ser 
1 5 10 • . 15 

Ala Glu Glu Thr Val Ala Leu He Glu Ser Gin Tyr Gly Thr Pro Ala 
20 25 30 

Leu Ala Leu Glu Ala Asp Val Arg Asp Arg Ala Ala Val Ser Ala Ala 
35 40 45 

Phe Glu Ala Thr Val Ala Glu Trp Gly Arg Phe Asp Tyr Leu Val Asn 
50 55 60 



Asn Ala Gly 
65 



<210> 32 
<211> 67 
<212> PRT 



53 



<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 
<400> 32 

Ala Ala Asp Gly Ala Arg Val Ala Val Val Asp Leu His lie Glu Ser 
15 10 15 



Ala Lys Glu Thr Val Ala Leu He Glu Ser Gin Tyr Gly Thr Pro Ala 
20 25 30 



Leu Ala Leu Glu Ala Asp Val Arg Asp Arg Ala Ala Val Ser Ala Ala 
35 40 45 



^he Glu Ala Thr Val Ala Glu Trp Gly Arg Phe Asp Tyr Leu Val Asn 
50 55 60 



Asn Ala Gly 
65 



• 



<210> 


33 


<211>^ 


348 


<212> 


PRT 


<213> 


unknown 


<220> 




^221> 


source 


|:223> 


ZF0050310 


<400> 


33 



Met Lys Ala lie Gin. Tyr Ala Arg He Gly Ala Glu Pro Glu Leu Thr 
1 ' 5 10 15 



Glu He Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val 
20 25 30 



Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe He Met Ser Leu Pro 
35 40 45 



Glu Glu Gin Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly 
50 55 '60 



Ala Gly Arg Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp He 
65 70 75 80 



54 



Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Ser Cys Trp 
85 90 

His Cys Ser Gin Gly Leu Glu Asn Tyr Cys Ser Arg Ala Lys Glu Leu 
100 105 

Gly lie Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe 
115 120 125 

Met lie Val Asp Ser Pro Arg His Leu Val Pro lie Gly Asp Leu Asp 
130 135 140 



_ 145 
^^a 



Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His 
- ^ 1 cn 155 160 



150 



lie Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ala Tyr Ala Val 
165 170 175 



Val lie Gly Thr Gly Gly Leu Gly His Val Ala He Gin Leu Leu Arg 
180 185 190 

His Leu Ser Ala Ala Thr Val He Ala Leu Asp Val Ser Ala Asp Lys 
195 200 205 

Leu Glu Leu Ala Thr Lys Val . Gly Ala His Glu Val Val Leu Ser Asp 
210 215 220 



Lys Asp Ala Ala Glu Asn Val Arg Arg He Thr Gly Ser Gin Gly Ala 



_ 225 
^jj^kla 



230 



235 



,1a Leu Val Leu Asp Phe Val Gly Tyr Gin Pro Thr He Asp Thr Ala 
245 250 255 



Met Ala Val Ala Gly Val Gly Ser Asp Val Thr He Val Gly He Gly 
260 265 270 

Asp Gly Gin Ala His Ala Lys Val Gly Phe Phe Gin Ser Pro Tyr Glu 
275 280 285 

Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu He Glu 
290 295 300 



Leu He Asp Leu Ala His Ala Gly He Phe Asp He Ala Val Glu Thr 

315 320 



305 



310 



Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly 



55 





325 330 335 



Thr Leu Ser Gly Arg Ala Val Val Val .Pro Gly Leu 
340 345 



<210> 34 

<211> 348 

<212> PRT 

<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 

<400> 34 

Met Lys Ala He Gin Tyr Thr Arg He Gly Ala Glu Pro Glu Leu Thr 
1 5 10 15 

Glu He Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val 
20 25 30 

Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe He Met Ser Leu Pro 
35 40 45 

Glu Glu Gin Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly 
50 . 55 60 

Ala Gly Arg Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp He 
65 70 ■ 75 . 80 

Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Ser Cys Trp 
85 90 95 

His' Cys Ser Gin Gly Leu Glu Asn Tyr Cys Ser Arg Ala Lys Glu Leu 
100 105 110 

Gly He Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala . Glu Phe 
115 120 125 

Met He Val Asp Ser Pro Arg His Leu Val Pro He Gly Asp Leu Asp' 
.130 135 140 

Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His 
145 150 155 160 



Ala He Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ala Tyr Ala Val 



56 





165 170 175 

Val lie Gly Thr Gly Gly Leu Gly His Val Ala He Gin Leu Leu Arg 
180 185 190 

His Leu Ser Ala Ala Thr Val He Ala Leu Asp Val Ser Ala Asp. Lys 
195 200 205 

Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp 
210 215 220 

Lys Asp Ala Ala Glu Asn Val Arg Arg He Thr Gly Ser Gin Gly Ala 
225 230 235 240 

Ala Leu Val Leu Asp Phe Val Gly Tyr Gin Pro Thr He Asp Thr Ala 
245 250 255 

Met Ala Val Ala Gly Val Gly Ser Asp Val Thr He Val Gly He Gly 
260 265 270 . 

Asp Gly Gin Ala His Ala Lys Val Gly Phe Phe Gin Ser Pro Tyr Glu 
275 280 285 

Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu He Glu 
290 295 300 

Leu lie Asp Leu Ala His Ala Gly He Phe Asp He Ala Val Glu Thr 
305 310 315 320 

Phe Ser Leu Asp Asn Gly Ala .Glu Ala Tyr Arg Arg Leu Ala Ala Gly 
325 330 335 



Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu 
340 345 



<210> 


35 


<211> 


488 


<212> 


DNA 


<213> 


unknown 


<220> 




<221> 


source 


<223> 


ZF0002326= 




ZF0050197= 




ZF0050330= 




ZF0051321= 




ZF0050544= 



57 



ZF0050310= Arthrobacter paraffineus; ZF00028 62= Streptomyces 
clavuligerus; ZF0050292= Bakterium; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0002437= Streptomyces; ZF0003712= Micromonospora; ZF0003765- 
Streptomyces; ZF0051305= Bakterium; ZF0003513= Actinomyces; 
ZfSSo993= Kocuria;- ZF0002018= Streptomyces; ZF0003767= Actinomyces; 
ZF0002332= Streptomyces diastatochromogenes; ZF0003768= Actinomyces; 
ZF000237 9= Streptomyces coelescens; ZF0002351= Nonomuraea 
roseoviolacea; ZF0003769= Actinomyces; 



<400> 35 • 
gggccatggg 

cgcgcccaag 

ttcatgatcg 

acggtgccgc 

aaacttcgcg 

.ttcagctcc 

aagctcgaac 

gccgagaacg 

ggctacca 



gttgtggcaa 

aactcggaat 

tcgattctcc 

tgaccgacgc 

gaggctcgta 

tccgtcacct 

tggcaaccaa 

tccgcaagat 



ctgttggcac 
caatcctccc 
tcgccacctt' 
cggtctgacg 
cgcggttgtc 
ctcggcgtca 
ggtaggcgct 
cactggaagt 



tgctcacaag 

ggtctcggtg 

gtcccgatcg 

ccgtatcacg 

attggtaccg 

acggtcatcg 

cacgaagtgg 

caaggcgccg 



gactcgagaa 
cacccggcgc 
gtgacctcga 
cgatcaagcg 
gcgggctcgg 
ctttggacgt 
ttctgtccga 
cactggttct 



ctattgctct 

gttggccgag 

cccggtcaag 

ttctctgccg 

ccacgtcgcc 

gagcgcggac 

caaggacgcg 

cgacttcgtt 



60 
120 
' 180 
240 
300 
360 
420 
480 
488 



<210> 36 

<211> 385 

<212> DNA 

<213> unknown 




<220> 

<221> 
k223> 



soTJirce 

ZF0002326= Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0050197= Pseudomonas oleovorans; ZF0050294= Rhodococcus; 
ZFa050330= Bacillus; ZF0051303= Bakterium; ZF0051337= Methylomonas; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544= Phyllobacterium rubiacearum; ZF0002852= Rhodococcus; 
ZF0050310= Arthrobacter paraffineus; ZF0002862= Streptomyces 
clavuligerus; ZF0050292= Bakterium; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0002437= Streptomyces; ZF0003712= Micromonospora; ZF0003765- 

tomyces; ZF0051305= Bakterium; ZF0003513= Actinomyces; 
Zf5o50993= Kocuria; ZF0002018= Streptomyces; ZF0003767= Actinomyces 
ZF0002332= Streptomyces diastatochromogenes; ZF0003768= Actinomyces 
ZF0002379= Streptomyces coelescens; ZF0002351= Nonomuraea 
roseoviolacea; ZF0003769= Actinomyces; 



<400> 36 . . . . . 

gggccatggg gttgtggcaa ctgttggcac tgctcacaag gactcgagaa ctattgctct 

cgcgcccaag aactcggaat caatcctccc ggtctcggtg cacccggcgc gttggccgag 

ttcatgatcg tcgattctcc tcgccacctt gtcccgatcg gtgacctcga cccggtcaag 



60 
120 
180 



58 





acggtgccgc tgaccgacgc cggtctgacg ccgtatcacg cgatcaagcg ttctctgccg 
aaacttcgcg gaggctcgta cgcggttgtc attggtaccg gcgggctcgg ccacgtcacc 
attcagctcc tccgtcacct ctcggcggca acggtcatcg ctttggacgt gagcgcggac 
aagctcgaac tggcaaccaa ggtag 

<210> 37 

<211> 486 

<212> DNA 

<213> unknown 

<220> 

<221> source 

k<223> ZF005028 6= Corynebacterium hoagii 

<400> 37 0. 4. +- 

ggcccttggg gttgcggacg ttgctggcac tgcgcgcagg ggctcgagaa ctactgctcc 

cgc^caaggg aactcggcat cgccccaccc ggcttgggcg cgccgggcgc gatcgccgag 
tacatgatcg tcgactcgcc gcgtcacctg gtcccgatcg gtgacctcga ccccgtcacg 
acggtgccgc tgaccgacgc cgggctcacc ccgtaccacg cgatcaaacg gtcgctcggc 
aagctccgcg ccggctcgta cgcagtcgtg atcggcaccg gaggcctcgg acacgtcggc 
atccagctgc tccgccacct gtcccctgca cgcatcatcg ccctcgacgt caacgacgag 
aagctcgcgt tcgcccgcga ggtcggcgcg cacgagaccg tgttgtcgaa cgccgacgcc 
gccgcgaacg tccggaagat cacgggttcg gccggtgccg cgctggtcct agacttcgtc 
ggctac 

<210> 38 

<211> 483 . 

<212> DNA 

. <213> unknown 
<220> 

<221> source 

<223> ZF0050310=. Arthrobacter paraf fineus 

<400> 38 ^ 4. 4.4. +. 

ggcccatggg gctgtggcag ctgttggcac tgctcgcaag gactcgaaaa ctactgttct 

cgggcaaaag aactcggcat caatcctcct ggtctcggtg cacccggcgc gttggccgaa 

ttcatgatcg tcgattcacc tcgccacctc gtcccgatcg gcgacctcga tccggtcaag 

acggtgccac tgaccgacgc cggtctgact ccgtatcacg cgatcaagcg ttcactgccg 



240 
300 
360 
385 



60 
120 
180 
240 
300 
360 
420 
480 
486 



60 
120 

180 
240 



59 



aaacttcgcg gtggcgcgta cgccgtcgtc atcggtaccg gcggtctcgg ccatgtcgcc 
atccaactcc tccgccacct ctcggcagca accgtcatcg cactcgacgt gagcgcggac 
aagctcgtac tggcaaccaa ggtaggcgct cacgaagtgg tcctgtccga caaggacgcg 
gccgagaacg tccgcaggat caccggaagt cagggcgccg cactggttct tgacttcgtt 
ggc 



300 
360 
420 
480 
483 



<210> 39 

<211> 210 

<212> DNA 

<213> unknovTn 




source 

ZF0004210= Actinomyces; 
Actinomyces; ZF0003860= 
ZF00038 68= Actinomadura 
Actinomyces ; ZF00038 66= 
ZF00038 62= Actinomadura 
Actinomadura ; Z FO 0 0 4 2 1 6 
ZF0004209= Actinomadura 
Act inomy ce s; ZFO 004063= 
ZF0006405= Streptomyces 
Act inomadur a ; Z FO 0 0 4 0 7 0 
ZF0004217= Actinomyces; 
Actinomadura; ZF0006138 
ZF0051203= Bakterium; 



ZF0004212= Actinomyces; ZF0004211= 
Actinomyces; ZF0004218= Actinomyces; 

ZF0004213== Actinomyces; ZF0003876= 
Actinomyces; . ZF0003864« Actinomyces; 
ZF0003869= Actinomyces; ZF0003867= 
;= Actinomyces; ZF0004235- Actinomyces; 
; ZF0004214= Actinomyces; ZF0003871= 
Actinomadura; ZF0004052= Actinomadura; 
ZF00038 65= Actinomadura; ZF0004047= 
1= Actinomyces; ZF0004085= Actinomyces; 

ZF000408 9= Actinomadura; ZF0004090== 
= Streptomyces; ZF0004236« Actinomadura; 




ggaccgtggg gctgcggcac gtgcgtcaag tgcgccgagg gcaaggagaa ctactgcctg 
igcgccaagg aactcggcat cgccccgccc ggactcggct cgcccggcgc catggccgag 
acatgatcg tcgacgaccc gcgccacctg gtgccgctcg gcggtctcga cccggtccag 
gccgtgccgc tcactgacgc gggcctgaca 



60 
120 
180 
210 



<210> 


40 


<211> 


282 


<212> 


DNA 


<213> 


unknown 


<220> 




<221> 


source 


<223> 


ZF0Q02326= 




ZF0051321== 




ZF0050544= 




ZF00023.49= 



Lactobacillus bulgaricus; 



60 



ZF0003764= Streptomyces ; ZF0002331= Actinoplanes philippi-nensxs; _ 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakterium; 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces; ZF0004821= 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes ; ZF0002396- 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; ZF0006087= 
Streptomyces; ZF0050446= Bakteriiim; ZF0050445= Bakterium; ZF0006086= 
Streptomyces; ZF0002322= Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 



<400> 40 ^ ^x. 4- 4- 

tgtcacaccg atcaccacat cgtcaccggc gcgaccccga tgccgtcgtt cccggtcatg 

ggcgggcacg agggttcggg cgtcatcacc aagctcggcc ctgaggtcaa gggactggag 

gtcggcgacc acgtcgttct gtccttcatt ccggcttgtg gaacctgtcc ggcgtgttcg 

gccgggcatc agaatctttg tgacctcggg atgggcctcc tcagcggcca agccatcagc 

[acggcacgt accggatcca ggctcgcggc gaaaacgtga tc 



60 
120 
180 

240 
282 



<210> 41 

<211> 276 

<212> DNA 

<213> xinknovm 



<220> 

<221> 
<223> 




source 

ZF0002326- Actinoplanes missouriensis; ZF0003505- Streptomyces; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF005054 4- Phyllobacterium rubiacearum; ZF0002031- Streptomyces; 
ZF000234 9= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993- Kocuria; ZF0002018= Streptomyces; ZF0003767- Actinomyces; 
ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis; ^ 
ZF0002441- Streptomyces; ZF0051307- Bakterium; ZF0051301=- Bakterium; 
ZF0051240- Bakterium; ZF0002333= Rhodococcus erythropolis ; 
ZF0003713- Micromonospora; ZF0004980= Streptomyces; ZF0004821- 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes; ZF0002396- 
Actinoplanes; ZF0003781= Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; 2F0006087- 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086= 
Streptomyces; ZF0002322- Rhodococcus; ZF0003538= Actinomyces; 
ZF0003535= Actinomyces; 



<400> 41 a. ^ 4- 

tgccataccg acgatcatgc tgtgaccggt gatctggcag tcccactccc cgtgatcggt 
ggccacgaag gcgcgggcat agtggagaaa gtcggccccg gcgtgcgaga cgtcgaggta 
ggcgatcacg tcgtcctctc cttcattccc tcgtgtggac gctgccgttg gtgcgcagtc 
ggacagagca acctctgcga cctcggcgcc attctgatgg ccggcgcaca ggtcgacggg 
acgtaccgcg cgacagctcg cgggcacgac gtcgga 



60 
120 
180 
240 
276 



<210> 42 



61 



<211> 276 
<212> DNA 
<213> unknovm 



<220> 

<221> 
<223> 




rF00r2326= Actinoplanes -i-^-f --^'^ ^2^^^''°"'" 
ZF0051321= Bakterium; ZF0050782= ^^^^^obacxllus bulgarxcus, 
ZF0050544= PhvUobacterium rubiacearum; ZF0002031- Streptomyces, 
ZF0002349= sSeptomyces spectabilis; ZF0002434= Streptomyces; 
If225099L IocSS? ZF0002018= Streptomyces; ZF0003767= Actinomyces; 
lllfol'll Streptomyces; ZF00023 Act~^ 

1fSo03713= Micromonospora; 2F0004980= _ Streptomyces; IJOOO^S^l; 

ISeptomyces; ZF0002322= Rhodococcus ; ZF0003538= Actxnomyces; 
ZF0003535= Actinomyces; 



Jgccatacag acgatcatgc tgtgaccggt gatctggcag tcccactccc cgtgatcggt 
ggccacgaag gcgcgggcat agtggagaaa gtcggccccg gcgtgcgaga cgtcgaggta 
ggcgatcacg- tcgtcctctc cttcattccc tcgtgtggac gctgccgttg gtgcgcagtc 
ggacagagca acctctgcga cctcggcgcc attctgatgg ccggcgcaca ggtcgacggg 
acgtaccgcg cgacagctcg cgggcacgac gtcgga 



60 
120 
180 
240 
276 




<210> 43 

<211> 276 

<212> DNA 

<213> unknown 



<220> 

<221> 
<223> 



Z?OoSS32-6= Actinoplanes -issouriensis; ZF0003505= Streptomyces; . 
ZFn051321= Bakterium; ZF0050782= Lactobacillus bulgaricus, 
11^225^544= pSyllobac^erium rubiacearum; ZF0002031= Streptomyces; 
'zF0002l49= Streptomyces spectabilis; ZF0002434= Streptomyces^^^^ 
ZF0050993= Kocuria; ZF0002018= Streptomyces; ZF00037 67- Actinomyces 
ZF0003764= Streptomyces; |!:0002331= -^l^J^l^^^,^^^^^^^^ 
ZF0002441= Streptomyces; ZF0051307- Baiccerium, ^cuuoj. 
ZF0051240= Bakterium; ZF0002333= Rhodococcus ^^y^hropolis; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces |J0004821- 
Actinomvces; ZF0002359= Actinoplanes lanthmogenes, ZFOOO^jyb 
ASiSopSnJ;; ZF0003781- Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; pO?°^°^;_„-nfinfi6 
Itreptomyces; zlo05S446= Bakterium; ZF0050445= Bakterium; ZF0006086 



62 



Streptomyces; ZF0002322= Rhodococcus; ZF0003538= Actinomyces j 
ZF0003535= Actinomyces; 

<400> 43 ^ ^ 4. 4- 

tgtcatactg acgatcatgc tgtgaccggt gatctggcag tcccactccc cgtgatcggt 

ggccacgaag gcgcgggcat agtggagaaa gtcggccccg gcgtgcgaga cgtcgaggta 

ggcgatcacg tcgtcctctc cttcattccc tcgtgtggac gctgccgttg gtgcgcagtc 

ggacagagca acctctgcga cctcggcgcc attctgatgg ccggcgcaca ggtcgacggg 

acgtaccgcg cgacagctcg cgggcacgac gtcgga 

<210> 44 

<211> 276 

<212> DNA 

213> unknown 



60 
120 
180 
240 
276 




<220> 

<223> ZF000232 6- Actinoplanes missouriensis; ZF0003505= Streptomyces; 
ZF0051321= Bakterium; ZF0050782- Lactobacillus bulgaricus; 
ZF0050544= Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF0002349= Streptomyces spectabilis; ZF0002434= Streptomyces; 
ZF0050993= Kocuria; ZF0002018= Streptomyces; ZF0003767- Actinomyces; 
ZF0003764= Streptomyces; ZF0002331= Actinoplanes philippinensis; ^ 
ZF0002441- Streptomyces; ZF0051307= Bakterium;. ZF0051301- Bakterium; 
ZF0051240= Bakterium; ZF0002333= Rhodococcus erythropolis; 
ZF0003713= Micromonospora; ZF0004980= Streptomyces; ZF0004821- 
Actinomyces; ZF0002359- Actinoplanes ianthinogenes; ZF0002396- 
Actinoplanes; ZF0003781- Actinomyces; ZF0003512= Actinomyces; 
ZF0006093= Streptomyces; ZF0006103= Streptomyces; 2F0006087- 
Streptomyces; ZF0050446- Bakterium; ZF0050445- Bakterium; ZF0006086- 
Streptomyces; ZF0002322- Rhodococcus; ZF0003538- Actinomyces; 
ZF0003535= Actinomyces; 

60 
120 
180 
240 
276 



-400> 44 0. 4- 4- 

Pgtcacaccg acgatcatgc tgtgaccggt gatctggcag tcccactccc cgtgatcggt 

ggccacgaag* gcgcgggcat agtggagaaa gtcggccccg gcgtgcgaga cgtcgaggta 

ggcgatcacg tcgtcctctc cttcattccc tcgtgtggac gctgccgttg gtgcgcagtc 

ggacagagca acctctgcga cctcggcgcc attctgatgg ccggcgcacg ggtcgacggg 

acgtaccgcg cgacagctcg cgggcacgac gtcgga 

<210> 45 

<211> 276 

<212> DNA 

<213> unknown 



<220> 



63 



<221> source 

<223> ZF0002326- Actinoplanes missouriensis ; ZF0003505= Streptomyces ; 
ZF0051321= Bakterium; ZF0050782= Lactobacillus bulgaricus; 
ZF0050544- Phyllobacterium rubiacearum; ZF0002031= Streptomyces; 
ZF000234 9= Streptomyces spectabilis; ZF0002434- Streptomyces; 
ZF0050993- Kocuria; ZF0002018= Streptomyces; ZF00037 67= Actinomyces 
ZF00037 64- Streptomyces; ZF0002331= Actinoplanes philippinensis; 
ZF0002441= Streptomyces; ZF0051307= Bakterium; ZF0051301= Bakterium 
ZF0051240= Bakteriiam; ZF0002333= Rhodococcus erythropolis ; 
ZF0003713- Micromonospora; ZF0004980= Streptomyces; ZF0004821- 
Actinomyces; ZF0002359= Actinoplanes ianthinogenes ; ZF0002396- 
Actinoplanes;- ZF0003781- Actinomyces; ZF0003512= Actinomyces; 
ZF0006093- Streptomyces; ZF0006103- Streptomyces; ZF0006087= 
Streptomyces; ZF0050446= Bakterium; ZF0050445= Bakterium; ZF0006086 
Streptomyces; ZF0002322= Rhodococcus; ZF0003538- Actinomyces; 
ZF0003535= Actinomyces; 



•r 
9 



<400> 45 ^ ^ 4. 

tgtcacactg acgatcatgc tgtgaccggt gatctggcag tcccactccc cgtgatcggt bu 

[gccacgaag gcgcgggcat agtggagaaa gtcggccccg gcgtgcgaga cgtcgaggta 120 

'ggcgatcacg tcgtcctctc cttcattccc tcgtgtggac gctgccgttg gtgcgcagtc 180 

ggacagagca acctctgcga cctcggcgcc attctgatgg ccggcgcaca ggtcgacggg 240 

27 6 

acgtaccgcg cgacagctcg cgggcacgac gtcgga 

<210> 46 

<211> .279. 

<212> DNA 

<213> unknown 
<220> 



• 



<221> source 

<223> ZF0050310= Arthrobacter paraffineus 



k400> 46 
tgccacacag 


atctgttcac 


gaagtcggtg 


ctaccggaaa 


ggctcggccc 


ctgcgtgttc 


60 


gggcacgaag 


gagcgggggt 


ggtcgaggcc 


gtcggctcgt 


cgatcgacag 


cattgcgccc 


120 


ggtgatcacg tgttgctgag 


ctaccgcagt 


tgcggtgtgt 


gcaggcagtg 


cctcagcggt 


180 


catcgggcgt 


actgcgaaag 


ctcacacggg 


ctcaacagct 


ctggcgcacg 


caccgacggc 


240 


tcgacgccgg 


tccggcgaag 


cggaactccg 


atacggtcc 






279 



<210> 47 

<211> 279 

<212> DNA 

<213> unknown 



<220> 



64 



<221> source 

<223> ZF0002333== Rhodococcus erythropolis 



tgtc^tactg atctgttcac gaagacggtg ctaccggaaa agctcgggcc ctgcgtgttc 60 

ggacacgaag gcgccggcgt cgtgcaagcc gttggctcgt cgatcgacaa catcgcggct 120 

ggtgatcacg tattgctgag ctaccgcagt tgcggtgtat gcaggcaatg tctcagcgac 180 

catcgggcgt actgcgaaag ctcacacggg ctcaacagct ctggcgcacg caccgacggc 240 
tcgacgccgg tccggcgaaa cggaactccg atacggtcc 



279 




<210> 48 

<211> 360 

<212> DNA 

<213> unknown 

<220> 




^221^ source 

<223> ZF0051303= Bakterium; ZF0051337= Methylomonas; ZF00°28 62= 

Streptomyces clavuligerus ; ZF0050292= Bakterxum; ZF0051305- 
Bakteriim; ZF0003513= Actinomyces; ZF0002351= Nonomuraea 
roSeoJi^Lcel; ZF0003769= Actinomyces; 2F0002017= Streptomyces; 
ZF0051306= Bakterium; ZF0002016= Streptomyces;, ZF0003504- 
Actinomyces; ZF0006073= Streptomyces; ZF0003770= Actinomyces; 
ZF0002352= Actinoplanes italicus; ZF0002378= Streptomyces 
aureomonopoSSiJs; ZF0006089= Streptomyces; ^^0006106= Streptomyces 
ZF0051325= Bakterium; ZF0006108= Streptomyces; ZF0002440- 
Streptomyces; ZF0051302= Bakterium; ZF0003532= Actinomyces; 
ZF0003548= Nocardiaf om^ 

.tgcgjgacgg accgcgagat cgcctcgggc atctacgggt gggcgccgcc gggacgcgaa 60 
cacctcgtcc tcgggcacga atcgctgggc cgagtacgca ccgcgcccga cggcagcggt 120 
ttcgccgccg gtgatctcgt cgtcgggatc gtgcgcaggc ccgatccggt gccgtgcggg 
gcgtgtgcgc acggtgagtt cgacatgtgc cgcaacggtg agtacgtcga gcgcgggatc 
aagcagatcg acgggtacgg gtcgacgtcg tgggtggtgg acgccgacta cacggtcaag 
ctggacccgg cgctcaccga ggtgggtgtg ctgatggaac cgacgacggt gcttggccaa 



180 
240 
300 

360 



<210> 49 

<211> 421 

<212> DNA 

<213> unknown 
<220> 



65 



<221> source , , „i-.r,or,oo co_ 

<223> ZF0051303= Bakterium; ZF0051337= Methylomonas ; ZF00028 62- 

Streptomyces clavuligerus; ZF0050292= Bakterium; ZF0051305= 
Bakterium; ZF0003513= Actinomyces; ZF0002351= Nonomuraea 
roseoviolacea; ZF0003769= Actinomyces; ZF0002017= Streptomyces; 
ZF0051306= Bakterium; ZF0002016= Streptomyces; ZF0003504= 
Actinomyces; ZF0006073= Streptomyces; ZF0003770= Actinomyces; 
ZF0002352= Actinoplanes italicus; ZF0002378= Streptomyces 
■ aureomonopodiales; ZF0006089= Streptomyces; ZF0006106= Streptomyces; 
ZF0051325= Bakterium; ZF0006108= Streptomyces; ZF0002440- 
Streptomyces; ZF0051302= Bakterium; ZF0003532= Actinomyces; 
ZF0003548= Nocardiaf orm; 



<400> 49 
tgtggtaccg 



ccgctcacgc 
gacatccagg 
actgcctgg 
gacggcgcct 



ccggtcgacc 
ctctccttcc 
t 



acctgcacat 

tcggccacga 

tcggcgacct 

ccggccgccg 

tcgccgagta 

tcgacgtcgc 

cgctcgtcgg 



ccggtcctgg 
gttcgtcggc 
ggtcagcggc 
tcacctgtgc 
cgtggtgctg 
cgcgatcttc 
cgaggacgtg 



gacggatggg 
gaggtcgtcg 
gagggccacc 
cgcgcgaccg 
cccgcctcca 
gacccgttcg 
ctggtcaccg 



cgcagaagac 
agaccggccg 
tggtctgcgg 
tcggcctcgg 
acgtgtgggt 
gcaacgcggt 
gtgccggtac 



catcgccacc 
cgacgtgacc 
caagtgccgc 
tgtcggccgt 
• gcaccgggtg 
gcacaccgcg 
catcggcatc 



60 
120 
180 
240 
300 
360 
420 
421 




<210> 50 
<211> 414 
<212> DNA 
<213> unknown 
<220> 

<223> ZF0050197= Pseudomonas oleovorans; ZF0050294- Rhodococcus ; 

ZF0050330^ Bacillus, ZF0002852- Rhodococcus; ZF0050310- Arthrobacter 
paraffineus;- ZF0002437- Streptomyces; ZF0003712- Micromonospora; 
ZF0003765= Streptomyces; ZF0002332= Streptomyces ^ • 

diatsatochromogenes; ZF0003768= Actinomyces; ZF0002379== Streptomyces 
coelescens; ZF0002443= Streptomyces; ZF0002442- Streptomyces; ^ 
ZF0002436= Streptomyces; ZF0050994= Bakterium; ZF0050992= Bakterium; 
ZF0050442= Bakterium; ZF0002049= Streptomyces; ZF0006069- • 
Streptomyces; ZF0006075- Streptomyces; ZF0004724- Nocardiaf orm; 
^ ZF0002392= Actinoplanes nipponensis; ZF0002356= Actinoplanes 

brasiliensis; ZF0003501== Actinomyces; ZF0051322= Bakterium; . 
ZF0006078- Streptomyces; ZF0006092= Streptomyces; ZF0006090- 
Streptomyces; ZF0006084- Streptomyces; ZF0006068= Streptomyces; 
ZF0050284= Rhodococcus; ZF0050028- Agrobacterium tumefaciens; 
ZF0003540- Actinomyces; ZF0003528= Actinomyces; ZF0003529- 
Actinomyces; 

<400> 50 . 

ggcctgacga tcggccatga accggtgggc gtcatcgaaa agctgggcag cgccgtgacg 60 



66 



ggttaccgcg agggccaacg cgtgatcgcc ggcgcgatct gccccaactt caattcgtat 120 
gccgcgcagg atggcgcgcc gtcgcaggat ggcagctacc tggtggccag cggcgcatgc 180 
ggctgccatg gataccgggc cacggccggc tggcgctttg gcaacatcat cgatggcgcc 
caggccgaat acctgctggt tcccgatgcg cagggcaatc tggcgccggt tccggacaac 
ctgagcgatg aacaggtgct gatgtgcccg gacatcatgt ccaccggctt caaaggcgca 
gagaacgcac acatccgcat cggcgacacg gtggcggtat ttgcgcaggg acca 



240 
300 
360 
414 





<210> 51 
<211> 432 
<212> DNA 
<213> unknown 
'<220> 

<221> source ^ 

<223> ZF0050197= Pseudomonas oleovorans; ZF0050294= Rhodococcus ; 

ZF0050330= Bacillus, ZF0002852= Rhodpcoccus ; ZF0050310- Arthrobacter 
paraffineus; ZF0002437= Streptomyces;* ZF0003712= Micromonospora; 
ZF00037 65= Streptomyces; ZF0002332= Streptomyces 

diatsatochromogenes; ZF0003768= Actinomyces; ZF0002379= Streptomyces 
coelescens; ZF0002443= Streptomyces; ZF0002442= Streptomyces; 
ZF0002436= Streptomyces; ZF0050994= Bakterium; ZF0050992= Bakterium; 
ZF0C50442= Bakterium; ZF0002049= Streptomyces; ZF0006069= 
Streptomyces; ZF0006075= Streptomyces; ZF0004724= Nocardiaf orm; 
ZF0002392= Actinoplanes nipponensis; ZF0002356= Actinoplanes 
• brasiliensis; ZF0003501= Actinomyces; ZF0051322= Bakterium; 
ZF0006078= Streptomyces; ZF0006092= Streptomyces; ZF0006090- 
Streptomyces; ZF0G06084= Streptomyces; ZF0006068= Streptomyces; 
ZF0050284= Rhodococcus; ZF0050028= Agrobacteriiam tumef aciens ; 
ZF0003540= Actinomyces; ZF0003528= Actinomyces; ZF0003529- 
Actinomyces ; 



k400> 51 
tgcgggacgg 


acctgcacat cctcggaggt gacgtccccg aggtgaccga 


cgggcgaatc 


60 


ctgggccacg 


aggccgtcgg gaccgtggtc gaggtgggcg acggcgtaca 


gacactcgcg 


120 


ccgggcgatc 


gcgtgctcgt ctcgtgtgtc accgcatgcg gtacgtgccg 


gttctgccgc 


180 


gagagccgct 


acgggcaatg cctcggaggc ggcggctgga tcctcggaca 


cctgatcgac 


240 


ggcacccagg 


ccgaactcgt ccgagttccg tacgccgaca attcgaccca 


ccgcatcccc 


300 


gacggtgtga 


gcgacgagca gatgctcatg ctcgccgaca tcctgcccac 


ctcctacgag 


360 


gtcggtgttc 


tcaacggctg tctccggccg gcggacgtcg tcgtcatcat 


cggggccgac 


420 


gatcggcctc 


tt 




432 



<210> 52 



<211> 220 
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<212> DNA 
<213> unknown 
<220> 

<221> source 

<223> ZF0050310=' Arthrobacter paraffineus 

cgtcjacgtc gtcgtcgaca acgcgggatt cggaacacac ggggcattcg tggacgaaga 
tcacgagcgc gtcacgtccg agattcagct caacatcgcc acgctggtcg agctgacaca 
cacattcccg cccgaccttc tcaccggccg cggagcactg gtcaacatcg ccagcacagc 
gtcgttccag ccgacaccgg gcatggccgt ctactgcgct 

^210> 53 
^211> 226 
<212> DNA 
<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 
<400> 53 

cgtcgacgtc gtcgtccaca acgccggatt cggaacacac ggggcattcg tggacgaaga 
tctcgagcgc gtcacgtccg agattcagct caacatcgcc acgctggtcg agctgacaca 
cacattcctg cccgaccttc tcaccggccg cggagcactg gtcaacatcg ccagcacagc 
•tcgttccag ccgacaccgg gcatggccgt ctactgcgcc accaag 

<210> 54 

<211> 237 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0003535= Actinomyces 

<400> 54 ^ . . 

cgtgtcgacg tcgtggtgca caatgctgcg atcactcaaa aggccacttt tcgcgacatt 

acccccgccg attttgagcg catcctgcgg gtgaacctga ccggcgtctt caacctgagc 

caagccgtca ttcccttgat gattcagcgc ggcggaggaa gcatcgtctc gatttcctcg 




60 
120 
180 
220 



60 
120 
180 
226 



60 
120 
180 
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ctgtcggcgc agaacggcgg ggggatcttc ggcggcgccc actattgcgc aaccaag 



237 



<210> 55 

<211> 229 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0003535= Actinomyces 



<400> 55 . 
cgtcgacgtc gtcgtcgaca acgccggtct ggcactgggc acggcccccg cgccgcaggt 

gccgctaaag gactggcaga ccatggtgaa caccaacatc accggtctac tgaacatcac 

icaccatctc ctgccgacac tgatcgaccg taaaggtatc gtcgtcaacc tttcgtctgt 

tgccgcgcac tatccctata cgggcggcaa tgtatactgc gcctccaag 




<210> 56 

<211> 216 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 

<400> 56 ^4. 
:aggggatcg gatacgccac cgcgaagcgg ctgatcagcc tgggtgcgac ggtcgcgatc 

Igcgacatcg acgaagccac tctcgcgcga gcagccaagg atttgggcat ccgcacgttc 

gggcgcctcg acgtcaccga ccccgcctcg ttcttcgact tcctcgacac cgtcgaaggt 

gaactcggcc cgatcgacgt gctgatcaac aacgcg 

<210> 57 

<211> 225 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0080310= Arthrobacter paraffineus 

<400> 57 



60 
120 
180 
229 



60 
120 
. 180 
216 
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cagcggatcg ggctcgaaat tgcgcgcacc ttcatcaagg aaggcgcgac cgtcgttctc 

ggcgacatca acgaaaccgt gggaacggct gcggtcgccg aactcggtgg agagtcggtc 

gcccgtttcg cttcctgcga cgtgcgtgac tccggacagg tcgaggccat gctcgatctg 
gccgaaagcg ctttcggtcc agtcgatgtc atgatgaaca acgcg 

<210> 58 

<211> 216 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0080310= Arthrobacter paraffineus 

<400> 58 . 
caggggatcg gctaccagac cgcgaaggag ctgatccgac gaggtcaccg cgtggccatc 

ggcgacatcg acgaggcacg tgctaaggag accgccgccg aactgggggt taaggttgtc 

acccgcctcg atgtcaccga ccctgactcg ttcaaagact ttctcgacct agtcgaggga 

gacctcggcc ccctcgacgt gctgatcaac aacgcg 

<210> 59 . 

<211> 222 

<212> DNA 

<213> unknown 
<220> 



60 
120 
180 
225 



60 
120 
180 
216 



-221> source 

<223> ZF0080310= Arthrobacter paraffineus 

<400> 59 . ^ 41 

gggatcgggc tcgaaattgc gcgcaccttc atcaaggaag gcgcgaccgt cgttctcggc bu 

gacatcaacg aaaccgtggg aacggctgcg gtcgccgaac tcggtggaga gtcggtcgcc 120 

cgtttcgctt cctgcgacgt gcgtgactcc ggacaggtcg aggccatgct cgatctggcc 

gaaagcgctt tcggtccagt cgatgtcatc gtgaacaacg eg 

<210> 60 . 

<211> 222 

<212> DNA 

<213> unknown 



180 
222 
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<220> 

<221> source 

<223> ZF0080310= Arthrobacter paraffineus 

atcgjgctcg aaattgcgcg caccttcatc aaggaaggcg cgaccgtcgt tctcggcgac 
atcaacgaaa ccgtgggaac ggctgcggtc ggcgaactcg gtggagagtc ggtcgcccgt 
ttcgcttcct gcgacgtgcg tgactccgga caggtcgagg ccatgctcga tctggccgaa 
agcgctttcg gtccagtcga tgtcatggtc aacaacgccg gc 



<210> 61 

<211> 186 

<212> DNA 

:213> unknown 
<220> 



<221> source 

<223> ZF0002333= Rhodococcus erythropolis 

gtgccggtcg cggtcgtgga ccttcacatc gaaagtgcaa aggagaccgt cgcacttatc 
gaatcgcagt acggcacacc cgcgctcgcc cttgaggccg - atgtgcgcga ccgcgccgcc 
gtgagcgccg ctttcgaagc caccgtcgcc gaatggggac gcttcgacta cctcgtcaac 
aacgcc 



<210> 62 

.<211> 222 

<212> DNA 

<213> unknown 
<220> 



<221> source. 

■<223> ZF0002333= Rhodococcus erythropolis 
<400> 62 

ctcggccgtg aaatcgctct caagctcgct tccgaaggcg cctcggtagt ggtcaacgac 
ctcgatcccg aacctgccgc tcagaccgag cgcgatatca aagccacagg tggacaggct 
gtctcgtgcg tcggctccgt tgccgaggac gggttcgccg aacgcttcgt gaacactgcc 
gtcgaatcat tcggcggact cgacgtcatg gtgaacaacg eg 



60 
120 
180 
222 



■60 
120 
180 
186 



60 
120 
180 
222 



<210> 63 
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<211> 231 
<212> DNA 
<213> unknown 
<220> 

<221> source 

<223> ZF0002333= Rhodococcus erythropolis 

gcggggctcg gagtggaatt cgctcaccgc ttcgccgctc gcggtgcaaa tctggttctc 
gtcgccaggc gggcagatcg cctcgaagcc ctcgctaccg aactccgcgt cgcccacggc 
atcacagtca cagttctgcc tgccgacctg gcggcgcccg gcgtcggcgc aacactgcac 
caggagctga caagccgtgg catcaccgtc acctcgctga tcaacaacgc c 



210> 64 

<211> 216 

<212> DNA 

<213> unknown 
<220> 



<221> source 

<223> ZF0003535= Actinomyces 



•<400> 64 • ^ . 

ccagcggacg gctatcagac agcgaaggag ttgattcgac gaggccaccg ggtcgccatc 

gtcgacatcg acgaggcacg tgcgaagggg gccgccgccg aactcggggt gaaggtcgtc 

acccgactcg acgtcaccga acctgactcg ttcacaacgt ttctggacct ggtcgaacgt 

raactcggac ccctcgacat cctggtcaac aacgcg 



<210> 65 

<211> 201 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 

<400> 65 ^ o 

gccacggacg gtgcccgcgt cgcggtcgtg gaccttcaca tcgaaagtgc agaggagacc 

gtcgcactta tcgaatcgca gtacggcaca cccgcgctcg cccttgaggc cgatgtgcgc 

gaccgcgccg ccgtgagcgc cgctttcgaa gccaccgtcg ccgaatgggg acgcttcgac 



60 
120 
180. 
231 



60 
120 
180 
216 



60 
120 

180 
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201 

tacctcgtca acaacgccgg c 

<210> 66 
<211> 201 

<212> DNA 

<213> unknown 

<220> 

<221> source 

<223> ZF0050310= Arthrobacter paraffineus 
<400> 66 

gccgcggacg gtgcccgcgt cgcggtcgtg gaccttcaca tcgaaagtgc aaaggagacc 60 
gtcgcactta tcgaatcgca gtacggcaca cccgcgctcg cccttgaggc cgatgtgcgc 120 
igaccgcgccg ccgtgagcgc cgctttcgaa gccaccgtcg ccgaatgggg acgcttcgac 180 
tacctcgtca acaacgccgg c 

<210> 67 

<211> 1047 

<212> DNA 

<213> unknown 
<220> 

<221> source 

<223> 2;F0050310= Arthrobacter paraffineus 




201 



<400> 67 
katgaaggcaa 


tccagtacgc 


gagaatcggc gcagaacccg aactcacgga gattcccaaa 


60 


Fcccgagcccg 


gtccaggtga agtgctcctg gaagtcaccg ctgccggcgt ctgccactcg 


120 


gacgacttca 


tcatgagcct 


gcccgaagag cagtacacct acggccttcc tctcacgctc 


180 


ggccacgaag 


gcgccggccg 


ggtcgccgcc gtcggcgagg gcgtcgaagg actcgacatc 


240 


ggaaccaatg 


tcgtcgtcta 


cggaccctgg ggctgtggca gctgttggca ctgctcgcaa 


300 


ggactcgaaa 


actactgttc 


tcgggcaaaa gaactcggca tcaatcctcc tggtctcggt 


360 


gcacccggcg 


cgttggccga 


attcatgatc gtcgattcac ctcgccacct cgtcccgatc 


420 


ggcgacctcg 


atccggtcaa 


gacggtgcca ctgaccgacg ccggtctgac tccgtatcac 


480 


gcgatcaagc 


gttcactgcc 


gaaacttcgc ggtggcgcgt acgccgtcgt catcggtacc 


540 


ggcggtctcg 


gccatgtcgc 


catccaactc ctccgccacc tctcggcagc aaccgtcatc 


600 


gcactcgacg 


tgagcgcgga 


caagctcgaa ctggcaacca aggtaggcgc tcacgaagtg 


660 


gtcctgtccg 


acaaggacgc 


ggccgagaac gtccgcagga tcaccggaag tcagggcgcc 


720 
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gcactggttc tcgacttcgt 


cggctatcag 


cccaccatcg 


acaccgcgat 


ggctigticgcc 


780 


ggcgtcggat cggacgtcac 


gatcgtcggg 


atcggcgacg 


ggcaggccca 




840 


gggttcttcc aaagtcctta 


cgaggcttct 


gtgacagttc 


cgtactgggg 


tgcccgcaac 


900 


gagctgatcg aattgatcga 


cctggcgcac gccggcatct 


tcgacatcgc 


ggtggagacc 


960 


ttcagtctcg acaacggcgc 


cgaagcgtat 


cgacgactgg 


ccgccggaac 


gctcagcggc 


1020 


cgcgcggttg tggtccctgg tctgtag 








1047 



<210> . 68 

<211> 1047 

<212> DNA 

^:213> unknown 
220> 



<221> source 

<223> ZF0050310= Arthrobacter paraffineus 
<400> 68 

atgaaggcaa tccagtacac gagaatcggc gcagaacccg 




cccgagcccg gtccaggtga agtgctcctg . gaagtcaccg 
gacgacttca tcatgagcct gcccgaagag cagtacacct 
ggccacgaag gcgccggccg ggtcgccgcc gtcggcgagg 
ggaaccaatg tcgtcgtcta cggaccctgg ggctgtggca 
ggactcgaaa actactgttc tcgggcaaaa gaactcggca 
cacccggcg cgttggccga attcatgatc gtcgattcac 
•gcgacctcg atccggtcaa gacggtgcca ctgaccgacg 
gcgatcaagc gttcactgcc gaaacttcgc ggtggcgcgt 
ggcggtctcg gccatgtcgc catccaactc ctccgccacc 
gcactcgacg tgagcgcgga caagctcgaa ctggcaacca 
gtcctgtccg acaaggacgc ggccgagaac gtccgcagga 
gcactggttc tcgacttcgt cggctatcag cccaccatcg 
ggcgtcggat cggacgtcac gatcgtcggg atcggcgacg 
gggttcttcc aaagtcctta cgaggcttct gtgacagttc 
gagctgatcg aattgatcga cctggcgcac gccggcatct 
ttcagtctcg acaacggcgc cgaagcgtat cgacgactgg 
cgcgcggttg tggtccctgg tctgtag » 



aactcacgga 
ctgccggcgt 
acggccttcc 
gcgtcgaagg 
gctgttggca 
tcaatcctcc 
ctcgccacct 
ccggtctgac 
acgccgtcgt 
tctcggcagc 
aggtaggcgc 
tcaccggaag 
acaccgcgat 
ggcaggccca 
cgtactgggg 
tcgacatcgc 
ccgccggaac 



gattcccaaa 60 

ctgccactcg 120 

tctcacgctc 180 

actcgacatc 240 

ctgctcgcaa 300' 

tggtctcggt 360 

cgtcccgatc 420 

tccgtatcac 48 0 

catcggtacc 540 

aaccgtcatc 600 

tcacgaagtg 660 

tcagggcgcc 720 

ggctgtcgcc 7 80 
tgccaaagtc 840 
tgcccgcaac 900 
ggtggagacc 960 

gctcagcggc 1020 
1047 
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Patentanspfiiche 

Polypeptid mit der biologischen Aktivitat einer NAD- Oder NADP-abhangigen 
Alkoholdehydrogenase, das eine der nachfolgenden AminosSuresequenzen 
umfasst Oder aufweist: die Sequenz der SEQ ID NO.: 1, die Sequenz der SEQ 
ID NO.: 2, die Sequenz der SEQ ID NO.: 3 oder eine Sequenz, die zu 
mindestens 90% identisch mit der Sequenz von der SEQ ID NO.: 3 ist, die 
Sequenz der SEQ ID NO.: 4, die Sequenz der SEQ ID NO.: 5 oder eine 
Sequenz, die zu mindestens 90% identisch mit der Sequenz der SEQ ID NO.: 
5 ist, die Sequenz der SEQ ID NO.: 6 oder eIne Sequenz, die zu mindestens 
90% Identisch mit der Sequenz der SEQ ID NO.: 6 Ist, die Sequenz der SEQ 
ID NO.: 7 Oder eine Sequenz, die zu mindestens 70% Identisch mit der 
Sequenz der SEQ ID NO.: 7 Ist, die Sequenz der SEQ ID NO.: 8 oder eIne 
Sequenz, die zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 
8 ist, die Sequenz der SEQ ID NO.: 9 oder eine Sequenz, die zu mindestens 
70% Identisch mit der Sequenz der SEQ ID NO.: 9 ist, die Sequenz der SEQ 
ID NO.: 10 Oder eine Sequenz, die zu mindestens 70% Identisch mit der 
Sequenz der SEQ ID NO.: 10 ist, die Sequenz der SEQ ID NO.: 11 oder eine 
Sequenz, die zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 
11 ist, die Sequenz der SEQ ID NO.: 12 oder eine Sequenz, die zu 
mindestens 60% identisch mit der Sequenz der SEQ ID NO.: 12 ist, die 
Sequenz der SEQ ID NO.: 13 oder eine Sequenz, die zu mindestens 60% 
identisch mit der Sequenz der SEQ ID NO.: 13 Ist, die Sequenz der SEQ ID 
NO.: 14 Oder eine Sequenz, die zu mindestens 75% identisch mit der Sequenz 
der SEQ ID NO.: 14 ist, die Sequenz der SEQ ID NO.: 15 oder eine Sequenz, 
die zu mindestens 95% identisch mit der Sequenz der SEQ ID NO.: 15 ist, die 
Sequenz der SEQ ID NO.: 16 oder eine Sequenz, die zu mindestens 95% 
identisch mit der Sequenz der SEQ ID NO.: 16 ist, die Sequenz der SEQ ID 
NO.: 17 Oder eine Sequenz, die zu mindestens 75% identisch mit der Sequenz 
der SEQ ID NO.: 17 ist, die Sequenz der SEQ ID NO.: 18 oder eine Sequenz, 
die zu mindestens 70% identisch mit der Sequenz der SEQ ID NO.: 18 ist, die 
Sequenz der SEQ ID NO.: 19 oder eine Sequenz, die zu mindestens 70% 
identisch mit der Sequenz der SEQ ID NO.: 19 ist, die Sequenz der SEQ ID 
NO.: 20 Oder eine Sequenz, die zu mindestens 60% identisch mit der Sequenz 
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der SEQ. ID NO.: 20 ist. die Sequenz der SEQ ID NO.: 21 Oder eine Sequenz, 
die zu mindestens 90% identisch mit der Sequenz der SEQ ID NO.: 21 ist, die 
Sequenz der SEQ ID NO.: 22 oder eine Sequenz. die zu mindestens 70% 
identisch mit der Sequenz der SEQ ID NO.: 22 ist. die Sequenz der SEQ ID 
NO.: 23 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz 
der SEQ ID NO.: 23 ist, die Sequenz der SEQ ID NO.: 24 oder eine Sequenz, 
die zu mindestens 65% identisch mit der Sequenz der SEQ ID NO.: 24 ist, die 
Sequenz der SEQ ID NO.: 25 oder eine Sequenz, die zu mindestens 55% 
identisch mit der Sequenz der SEQ ID NO.: 25 ist, die Sequenz der SEQ ID 
NO.: 26 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz 
der SEQ ID NO.: 26 ist. die Sequenz der SEQ ID NO.: 27 oder eine Sequenz, 
die zu mindestens 55% identisch mit der Sequenz der SEQ ID NO.: 27 ist, die 
Sequenz der SEQ ID NO.: 28 oder eine Sequenz, die zu mindestens 75% 
identisch mit der Sequenz der SEQ ID NO.: 28 ist. die Sequenz der SEQ ID 
NO.: 29 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz 
der SEQ ID NO:: 29 ist. die Sequenz der SEQ ID NO.: 30 oder eine Sequenz, 
die zu mindestens 60% identisch mit der Sequenz der SEQ ID NO.: 30 Ist. die 
Sequenz der SEQ ID NO.: 31 oder eine Sequenz, die zu mindestens 55% 
identisch mit der Sequenz der SEQ ID NO.: 31 ist, die Sequenz der SEQ ID 
NO.: 32 Oder eine Sequenz, die zu mindestens 55% identisch mit der Sequenz 
der SEQ ID NO.: 32 ist, die Sequenz der SEQ ID NO.: 33 oder die Sequenz 
der SEQ ID NO.: 34. 

NukleinsSuremolekQI. das das Polypeptid nach Anspruch 1 kodiert. 

NukleinsauremolekQI. das komplementar zu dem NukleinsauremolekDI nach 
Anspruch 2 ist. 

Vektor, der das NukleinsauremolekQI nach Anspruch 2 oder 3 enthSlt. 



Nicht-menschlicher Wirt, der Polypeptid nach Anspruch 1 oder das 
NukleinsauremolekQI nach Anspruch 2 oder 3 oder den Vektor nach Anspruch 
4 enthalt. 
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6. Wirt nach Anspruch 5, der eine Zelle ist. 

7. Wirt nacli 5, der ein transgenes niclit-menschliclies Tier Ist. 

8. Wirt nach einem der Anspruclie 5 bis 7, der eine weitere, fQr die Cofaktor- 
Regenerierung geeignete Deliydrogenase oder ein diese Deiiydrogenase 
l^odierendes NukleinsauremolekQI aufweist. 

9. Wirt nach Anspruch 8, wobei die fQr die Cofaktor-Regenerierung geeignete 
Dehydrogenase eine Fornniatdehydrogenase oder eine 
Giukosedehydrogenase ist. 

''lO. Reaktionssytem enthaltend eine ein Substrat einer Dehydrogenase 
darstellende organische Verbindung, das Polypeptid nach Anspruch 1. den 
Vektor nach Anspruch 4 oder den Wirt nach einem der AnsprQche 5 bis 9 und 
gegebenenfalis einen Cofaktor fur das Polypeptid nach Anspruch 1 . 

11. Reaktionssytem nach Anspruch 10, wobei die ein Substrat einer 
Dehydrogenase darstellende organische Verbindung eine Carbonylverbindung 
ist. 

12. Reaktionssystem nach Anspruch 11, wobei die Carbonylverbindung eine 
Aidehyd Oder ein Keton ist. 

13. Realctlonssystem nach Anspruch 12, wobei das Keton ein unsymmetrisch 
substituiertes Keton ist. 

14. Reaktionssystem nach Anspruch 10, wobei die ein Substrat einer 
Dehydrogenase darstellende organische Verbindung ein Alkohol ist. 



15. 



Reaktionssystem nach Anspruch 14 wobei der Alkohol ein primSrer Alkohol 
Oder ein chiraler sekunddrer Alkohol ist. 
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Reaktionssystem nach einem der AnsprQche 10 bis 15, wobei der Cofaktor 
NADH, NADPH, NAD* oder NADP* ist. 

Verfahren zur Herstellung des Polypeptids nach Anspruch 1 oder eines durch 
das NukleinsauremolekQl nach Anspruch 2 kodierten Polypeptids, wobei man 
den Wirt nach einem der AnsprQche 5 bis 9 zuchtet und das Polypeptid 
isoliert. 

Verfahren zur Herstellung des Polypeptids nach Anspruch 1 oder eines durch 
das NukleinsauremolekQl nach Anspruch 2 kodierten Polypeptids, wobei man 
das Polypeptid aus einer KorperflQssigkeit oder Gewebeprobe des Wirts nach 
einem der AnsprQche 7 bis 9 isoliert. 

Verfahren zur Herstellung einer ein Produkt einer Dehydrogenase 
daretellenden organischen Verbindung, wobei man eine ein Substrat einer 
Dehydrogenase darstellende organische Verbindung mit dem Polypeptid nach 
Anspruch 1 , dem Wirt nach einem der AnsprQche 5 bis 9 oder mitlels des 
Reaktionssystems nach einem der AnsprQche 1 0 bis 16 umsetzt. 

Verfahren nach Anspruch 19, das ferner den Schritt der Isolierung des 
Produktes der Umsetzung umfasst. 

Verfahren nach Anspruch 20, das ferner die Weiterverarbeitung des Produktes 
in ein Arzneimittel umfasst. 

Verfahren nach Anspmch 20, welter umfassend den Schritt der 
Weiten/erarbeitung des Produkt in ein Folgeprodukt. 

Verfahren nach Anspruch 22, weiter umfassend den Schritt der Formulierung 
des Folgeproduktes in der Herstellung eines Arzneimittels. 

Verfahren nach einem der AnsprQche 19 bis 23, wobei das Produkt ein 
enantiomenreiner Alkohol ist 
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25. Ligand, der das Polypeptid nach Anspruch 1 spezrflsch bindet, wobel der 
Llgand kein Substrat oder Kofaktor des Polypeptids und kein davon erzeugtes 
Produkt 1st. 



26. Ligand nach Anspruch 25. der ein Antik5rper oder ein Fragnnent oder Derivat 
davon, ein Aptamer, oder eine niedermolekulare Substanz ist. 

27. Primer mit einer in Tabelle 1 dargestellten Sequenz. 

28. Primerpaar mit in Tabelle 1 dargestellten Sequenzen, wobei der erste Primer 
des Primerpaares ais Vonwarts-Primer und der zweite Primer des 
Primerpaares als ROckwarts-Primer zur Ampiifizierung eIner DNA-Sequenz 

" dient. 

29. Kit enthaltend 

(a) das Polypeptid nach Anspmch 1 ; 

(b) das NukleinsSuremolekQI nach Anspruch 2 oder 3; 

(c) den Vektor nach Anspruch 4; 

(d) den Wirt nach einem der AnsprQche 6 bis 9; 

(e) das Reaktionssystem nach einem der AnsprDche 10 bis 16; 

(f) den Liganden nach Anspruch 25 oder 26; 

(g) mindestens einen Primer nach Anspruch 27; und/oder 
k (h) mindestens ein Primerpaar nach Anspruch 28 
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Zusammenfassung 

Die Erfindung betrifft neue Polypeptide mit der biologischen Aktlvltat einer NAD- oder 
NADP-abhangigen Alkoholdehydrogenase. Des welteren betrifft die Erfindung diese 
Polypeptide kodierende Nukleinsauren, nicht-menschliche Wirte oder Wirtszellen 
sowie Reaktionssyteme, mit welchen gewunschte Produkte hergestellt werden 
kdnnen. Die erfindungsgemaBen Polypeptide werden bevorzugt in der Herstellung, 
ausgehend von Aldehyden bzw. Ketonen, von primaren und enantiomerreinen, 
sekundaren Alkoholen eingesetzt, die als Zwischenprodukte fQr Arzneimlttel dienen 
kSnnen. Alternativ konnen die erfindungsgemaUen Polypeptide auch fQr die 
umgekehrte Reaktion, also die Oxidation von Alkoholen unter Ausbildung von 
kAldehyden bzw. Ketonen, eingesetzt werden. 
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Biokatalytlsches und nachhalfiges Konzept: Asymmetrische Biokatalyse 

Asymmetrische 
Biokatalyse ■ 
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Fig. 1. 
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— 41splP77360|YPHC ECC 
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Fig. 2. Obersicht des Clusters 2 (= Primergruppe 2), basierend auf 33 Sequenzen 





Fig. 3. PCR-Typisierung mit Primergruppe 2 unter Verwendung verschiedeiier Pools 
Splrenbelegung: M: Marker 1 kb -DNA-Leiter; Spur V\P°° 1 ^'^St^mI^^/^^^ 
Spur 2: Pool 1 mat Primer ADHMll + 12; Spur 3: Pool 1 «^tP"«^,ADHM13 + 14; Spur 4- 
Pool 1 mit Primer ADHM15 + 16; Spur 5: Pool 2 mit Primer ADHM 9 + 10; Spur 6: Pool 2 
mit Primer ADHMl 1 + 12; Spur 7: Pool 2 mit Primer ADHM13 + 14; Spur 8: Pool 2 mit 
Primer ADHM15 + 16; Spur 9: Pool 3 mit Primer ADHM9 + 10; Spur 10: Pool 3 mit Pnmer 
ADHMlH-12 



